日本語AI Google ColabでKARAKURI LM 8x7B Instruct v0.1を動かす方法:初心者向け完全ガイド はじめにこの記事では、国産LLM(大規模言語モデル)の最新版である「KARAKURI LM 8x7B Instruct v0.1」をGoogle Colab上で動かす方法を、初心者の方にも分かりやすく解説します。このモデルは、Functio... 2024.06.22 日本語AIAI・機械学習
AI・機械学習 llama.cppで「Umievo-itr012-Gleipnir-7B」をサーバー起動してELYZA-tasks-100の推論結果をWandBに送信する方法 はじめにこんにちは!今回は、llama.cppを使って「Umievo-itr012-Gleipnir-7B」モデルをサーバーとして起動し、ELYZA-tasks-100の推論結果をWandB(Weights and Biases)に送信する... 2024.06.21 AI・機械学習日本語AI
AI・機械学習 llama.cppで「Umievo-itr012-Gleipnir-7B」をサーバー起動する方法(GoogleColab) はじめに本記事では、純粋なC/C++で実装された言語モデル推論ツールである「llama.cpp」を、Google Colab上でサーバーとして起動し、HTTPリクエストを送信して推論を行う方法を初心者向けに解説します。今回は、4つの強力な日... 2024.06.20 AI・機械学習日本語AI
AI・機械学習 RecurrentGemma 日本語版README RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合... 2024.06.16 AI・機械学習自然言語処理日本語AI
AI・機械学習 《UE5.4.2》WebSocket でLLMと日本語のやり取りを実現する!:新バージョン v0.2.0 リリースノート解説 この解説記事では、Unreal Engine 5.4.2 と WebSocket を用いて、C++ と Python 間で日本語を含むメッセージのやり取りを行うサンプルプロジェクトの最新バージョン v0.2.0 のリリースノートについて解説... 2024.06.11 AI・機械学習ゲーム開発日本語AI
AI・機械学習 Chat Vectorで日本語LLMをチャットモデルに改造する方法(GoogleColab付) はじめに最近、大規模言語モデル(LLM)の開発が急速に進んでいますが、データの制約により、多くのオープンソースLLMの性能は主に英語に限定されています。この問題に対処するため、Chat Vector論文では、簡単なモデルの算術演算を用いて事... 2024.05.29 AI・機械学習日本語AI大規模言語モデル
AI・機械学習 nekomata-14bモデルのollamaへのインポートと使用方法 前回の記事では、Ollamaを使ってモデルファイルを作成する方法を紹介しました。今回は、その手順に従って日本語の大規模言語モデル「nekomata-14b」をインポートし、実際に使用する方法を解説します。GGUFモデルのダウンロードURLM... 2024.05.28 AI・機械学習日本語AI大規模言語モデル
日本語AI LLM-jp-13Bを ollama で動かしてみた こんにちは!最近、AIや自然言語処理の分野で「大規模言語モデル(LLM)」という言葉をよく聞くようになりました。LLMは、膨大なテキストデータを学習して高度な言語理解・生成能力を獲得したAIモデルのことです。そんなLLMを手軽に試せるツール... 2024.05.22 日本語AI大規模言語モデルAI・機械学習
AI・機械学習 Kotoba-Whisper入門 – 日本語音声認識の新しい選択肢 はじめにKotoba-Whisperは、Asahi UshioとKotoba Technologiesが共同開発した、日本語の音声認識(ASR)に特化した蒸留Whisperモデルのコレクションです。OpenAIのWhisper large-... 2024.04.24 AI・機械学習日本語AI音声認識
AI・機械学習 日本語版:OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text~高品質な数学関連のウェブテキストを集めたオープンデータセット~ はじめに (Introduction)近年、大規模言語モデル(large language models)の発展により、数学的推論能力の向上が注目を集めています。特に、arXivやウェブ上の数十億トークンの数学文書を用いて事前学習を行ったM... 2024.04.15 AI・機械学習自然言語処理日本語AIデータセット