自然言語処理

AI・機械学習

ClearMLとLangChainライブラリを使ったAI質問応答エージェントの作成方法

はじめにLangChainは、言語モデル(LLM)を使用して、高度な自然言語処理タスクを実行するためのライブラリです。このライブラリを使用すると、質問応答や文章要約などの複雑なタスクを、比較的簡単にプログラミングすることができます。この記事...
Python

ClearMLとLangChainを連携させる方法

はじめにLangChainは、言語モデルを使ったアプリケーション開発のための人気のフレームワークです。ClearMLを使うと、LangChainのアセットやメトリクスを記録するためのClearML Taskを作成することができます。この記事...
AI・機械学習

検索拡張生成システム 設計する際の7つの失敗ポイント

はじめに (Introduction)大規模言語モデル(Large Language Models; LLMs)の発展により、ソフトウェアエンジニアは新しい人間とコンピュータのインタラクション(HCI)ソリューションを構築し、複雑なタスクを...
自然言語処理

Mistral-7B-Instruct-v0.3 使ってみた

はじめにMistral-7B-Instruct-v0.3は、Mistral-7B-v0.3をベースにインストラクションチューニングを施した大規模言語モデル(LLM)です。自然言語処理タスクにおいて優れた性能を発揮し、簡単に利用できるようデザ...
LangChain

Langchain統合のためのクックブック: Langfuse編

こんにちは!今日は、LangchainとLangfuseを組み合わせて使う方法について、初心者にもわかりやすく解説していきたいと思います。Langchainは自然言語処理に特化したPythonライブラリで、LangfuseはLangchai...
自然言語処理

言語モデルにおける思考連鎖推論の自己整合性の向上 (Self-Consistency Improves Chain of Thought Reasoning in Language Models)

要旨 (Abstract):大規模な事前学習済み言語モデルと思考連鎖プロンプティング(chain-of-thought prompting)を組み合わせることで、複雑な推論タスクにおいて励みになる結果が得られています。本論文では、新しいデコ...
AI・機械学習

JAXとWandbとSelf-Consistencyを使ったGemma Instruct 2Bモデルのファインチューニング入門

このノートブックでは、Kaggleの"AI Mathematical Olympiad"コンペティションに向けて、JAXをバックエンドに使用してGemma Instruct 2Bモデルをファインチューニングする方法を解説します。また、Wei...
AI・機械学習

JAXとWeights & Biasesを用いたGemma Instruct 2BモデルのFinetuning入門

はじめにこのノートブックでは、JAXをバックエンドに使用して、Kaggleの"AI Mathematical Olympiad"コンペティションに向けてGemma Instruct 2Bモデルをfinetuningする方法について解説します...
自然言語処理

JAXとWandbとSelf-ConsistencyとWeaveを使ったGemma Instruct 2Bモデルのファインチューニング入門

Gemma Instruct 2Bモデルは、自然言語処理タスクに優れたパフォーマンスを発揮する大規模言語モデルです。このモデルをファインチューニングすることで、特定のタスクにおける性能をさらに向上させることができます。 本記事では、JAX、...
AI・機械学習

SFTTrainer と TrainingArguments を使ってバッチ数を小さくしてステップを少なくした学習コードの解説

この記事では、Hugging Face の Transformers ライブラリの SFTTrainer と TrainingArguments を使って、限られたリソースでも効率的に言語モデルをファインチューニングする方法を解説します。特...