大規模言語モデル

AI・機械学習

Llama.cpp + WandBで始める日本語AI評価:Gemmaモデル(gemma-2-9b-it-Q4_K_M.gguf)のELYZA-tasks-100パフォーマンス分析

はじめにこんにちは!この記事では、Google Colab上でGemmaモデル(gemma-2-9b-it-Q4_K_M.gguf)を使用して、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は、大規模言語...
AI・機械学習

AutoRound: 大規模言語モデルのための高度な量子化アルゴリズム

近年の大規模言語モデル (LLM) の進化は目覚ましいものですが、その性能と引き換えに、莫大な計算資源とメモリが必要となる点が課題となっています。AutoRoundは、この課題を解決するべく開発された、LLMのための高度な量子化アルゴリズム...
AI開発

LangGraphとLangGraph Cloud:信頼性の高いエージェントを大規模に実行

はじめに大規模言語モデル(LLM)を活用したアプリケーション開発の分野で注目を集めているLangChainが、新たな進化を遂げました。2024年6月27日、LangChainは「LangGraph v0.1」の安定版リリースと、「LangG...
AI・機械学習

Googleが公開した新しいオープンLLM、Gemma 2へようこそ!

Gemma 2とは?Googleは、最先端のオープンLLMファミリーに新たに加わったGemma 2をリリースしました。Hugging FaceはGoogleと協力し、Hugging Faceエコシステムへの最高の統合を確実にすることに興奮し...
機械学習

Google Colabでのキャッシュ管理~初心者のための完全ガイド~

はじめにGoogle Colaboratory(通称:Colab)は、Pythonプログラミングと機械学習のための強力なクラウドベースの環境です。しかし、Colabセッションが終了すると、ローカルにインストールしたライブラリやダウンロードし...
AI・機械学習

Llama.cpp + WandBで始める日本語AI評価:KARAKURI-LMモデル(karakuri-lm-8x7b-instruct-v0.1-Q4_K_M.gguf)のELYZA-tasks-100パフォーマンス分析

はじめにこんにちは!今回は、Google Colab上でkarakuri-lm-8x7b-instruct-v0.1-Q4_K_M.ggufモデルを使って、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は...
AI・機械学習

Llama.cpp + WandBで始める日本語AI評価:karakuri-lm-8x7b-instruct-v0.1-ggufモデルのELYZA-tasks-100パフォーマンス分析

はじめにこんにちは!今回は、Google Colab上でkarakuri-lm-8x7b-instruct-v0.1-ggufモデルを使って、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は、大規模言語モ...
AI・機械学習

Mixture-of-Agents: 複数のAI言語モデルを組み合わせてパワーアップする新手法

はじめに論文の背景近年、人工知能(AI)の分野で大きな注目を集めているのが「大規模言語モデル(LLM:Large Language Model)」です。これらのモデルは、人間のような自然な文章を生成したり、複雑な質問に答えたりする能力を持っ...
日本語AI

Google ColabでKARAKURI LM 8x7B Instruct v0.1を動かす方法:初心者向け完全ガイド

はじめにこの記事では、国産LLM(大規模言語モデル)の最新版である「KARAKURI LM 8x7B Instruct v0.1」をGoogle Colab上で動かす方法を、初心者の方にも分かりやすく解説します。このモデルは、Functio...
AI・機械学習

llama.cppで「Umievo-itr012-Gleipnir-7B」をサーバー起動してELYZA-tasks-100の推論結果をWandBに送信する方法

はじめにこんにちは!今回は、llama.cppを使って「Umievo-itr012-Gleipnir-7B」モデルをサーバーとして起動し、ELYZA-tasks-100の推論結果をWandB(Weights and Biases)に送信する...