AI・機械学習

実験管理

ClearMLとLangChainを連携させる方法

はじめにLangChainは、言語モデルを使ったアプリケーション開発のための人気のフレームワークです。ClearMLを使うと、LangChainのアセットやメトリクスを記録するためのClearML Taskを作成することができます。この記事...
AI・機械学習

検索拡張生成システム 設計する際の7つの失敗ポイント

はじめに (Introduction)大規模言語モデル(Large Language Models; LLMs)の発展により、ソフトウェアエンジニアは新しい人間とコンピュータのインタラクション(HCI)ソリューションを構築し、複雑なタスクを...
AI・機械学習

AIを活用した効率的なコーディングのためのプロンプト集(実験中)

はじめにこのプロンプト集は、AIを活用してクリーンで保守性が高く、スケーラブルなコードを効率的に開発するためのガイドです。以下のプロンプトを参考に、プロジェクトの要件や進捗状況に合わせて適切なプロンプトを選択し、カスタマイズしてください。A...
AI・機械学習

AI を活用したソフトウェア開発のための個人的ガイド

下記のredditを日本語にしたものです。はじめに私は個人プロジェクトでコードを書く際、特に自動化のためのものを書く際には、AI を活用しています。この点について、人によって意見が分かれるようです。同じように AI を使っている人もいれば、...
AI・機械学習

初心者向け解説: CodeGemmaを使ったAI数学オリンピックコンペのベースラインノートブック

はじめにこのノートブックは、lua-cgemmaというライブラリを使用しています。lua-cgemmaは、gemma.cppのLuaバインディングを提供するライブラリです。gemma.cppは、Google Highway Libraryを...
AI・機械学習

言語モデルにおける思考連鎖推論の自己整合性の向上 (Self-Consistency Improves Chain of Thought Reasoning in Language Models)

要旨 (Abstract):大規模な事前学習済み言語モデルと思考連鎖プロンプティング(chain-of-thought prompting)を組み合わせることで、複雑な推論タスクにおいて励みになる結果が得られています。本論文では、新しいデコ...
AI・機械学習

Pythonを使った数学問題の自動生成: データ拡張テクニック集

Pythonを使った数学問題の自動生成: データ拡張テクニック集データサイエンスにおいて、質の高いデータを大量に用意することは重要ですが、データが不足している場合もあります。そこで、データ拡張(Data Augmentation)の手法を用...
AI・機械学習

CodeGemma – Googleが開発したコード特化の大規模言語モデル

CodeGemmaの概要CodeGemmaとは?Googleが開発したコード特化の大規模言語モデル(LLM)Gemmaモデルをベースに、追加で5000億トークンの英語データ、数学、コードを学習コードの補完や生成に特化し、論理的・数学的な推論...
AI・機械学習

JAXとWandbとSelf-Consistencyを使ったGemma Instruct 2Bモデルのファインチューニング入門

このノートブックでは、Kaggleの"AI Mathematical Olympiad"コンペティションに向けて、JAXをバックエンドに使用してGemma Instruct 2Bモデルをファインチューニングする方法を解説します。また、Wei...