日本語AI

Google ColabでKARAKURI LM 8x7B Instruct v0.1を動かす方法：初心者向け完全ガイド

はじめにこの記事では、国産LLM（大規模言語モデル）の最新版である「KARAKURI LM 8x7B Instruct v0.1」をGoogle Colab上で動かす方法を、初心者の方にも分かりやすく解説します。このモデルは、Functio...

2024.06.22

AI・機械学習日本語AI

はじめにこんにちは！今回は、llama.cppを使って「Umievo-itr012-Gleipnir-7B」モデルをサーバーとして起動し、ELYZA-tasks-100の推論結果をWandB（Weights and Biases）に送信する...

2024.06.21

AI・機械学習日本語AI

はじめに本記事では、純粋なC/C++で実装された言語モデル推論ツールである「llama.cpp」を、Google Colab上でサーバーとして起動し、HTTPリクエストを送信して推論を行う方法を初心者向けに解説します。今回は、4つの強力な日...

2024.06.20

AI・機械学習日本語AI

RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合...

2024.06.16

AI・機械学習日本語AI自然言語処理

この解説記事では、Unreal Engine 5.4.2 と WebSocket を用いて、C++ と Python 間で日本語を含むメッセージのやり取りを行うサンプルプロジェクトの最新バージョン v0.2.0 のリリースノートについて解説...

2024.06.11

AI・機械学習ゲーム開発日本語AI

はじめに最近、大規模言語モデル（LLM）の開発が急速に進んでいますが、データの制約により、多くのオープンソースLLMの性能は主に英語に限定されています。この問題に対処するため、Chat Vector論文では、簡単なモデルの算術演算を用いて事...

2024.05.29

AI・機械学習大規模言語モデル日本語AI

前回の記事では、Ollamaを使ってモデルファイルを作成する方法を紹介しました。今回は、その手順に従って日本語の大規模言語モデル「nekomata-14b」をインポートし、実際に使用する方法を解説します。GGUFモデルのダウンロードURLM...

2024.05.28

AI・機械学習大規模言語モデル日本語AI

こんにちは！最近、AIや自然言語処理の分野で「大規模言語モデル（LLM）」という言葉をよく聞くようになりました。LLMは、膨大なテキストデータを学習して高度な言語理解・生成能力を獲得したAIモデルのことです。そんなLLMを手軽に試せるツール...

2024.05.22

AI・機械学習大規模言語モデル日本語AI

はじめにKotoba-Whisperは、Asahi UshioとKotoba Technologiesが共同開発した、日本語の音声認識(ASR)に特化した蒸留Whisperモデルのコレクションです。OpenAIのWhisper large-...

2024.04.24

AI・機械学習日本語AI音声認識

はじめに (Introduction)近年、大規模言語モデル(large language models)の発展により、数学的推論能力の向上が注目を集めています。特に、arXivやウェブ上の数十億トークンの数学文書を用いて事前学習を行ったM...

2024.04.15

AI・機械学習データセット日本語AI自然言語処理