AI・機械学習

検索拡張生成システム設計する際の7つの失敗ポイント

はじめに (Introduction)大規模言語モデル(Large Language Models; LLMs)の発展により、ソフトウェアエンジニアは新しい人間とコンピュータのインタラクション(HCI)ソリューションを構築し、複雑なタスクを...

2024.05.24

AI・機械学習情報検索自然言語処理

AIを活用した効率的なコーディングのためのプロンプト集（実験中）

はじめにこのプロンプト集は、AIを活用してクリーンで保守性が高く、スケーラブルなコードを効率的に開発するためのガイドです。以下のプロンプトを参考に、プロジェクトの要件や進捗状況に合わせて適切なプロンプトを選択し、カスタマイズしてください。A...

2024.05.23

AI・機械学習ソフトウェア開発プログラミングプロンプトエンジニアリング

LLM-jp-13Bを ollama で動かしてみた

こんにちは！最近、AIや自然言語処理の分野で「大規模言語モデル（LLM）」という言葉をよく聞くようになりました。LLMは、膨大なテキストデータを学習して高度な言語理解・生成能力を獲得したAIモデルのことです。そんなLLMを手軽に試せるツール...

2024.05.22

AI・機械学習大規模言語モデル日本語AI

AI を活用したソフトウェア開発のための個人的ガイド

下記のredditを日本語にしたものです。はじめに私は個人プロジェクトでコードを書く際、特に自動化のためのものを書く際には、AI を活用しています。この点について、人によって意見が分かれるようです。同じように AI を使っている人もいれば、...

2024.05.22

AI・機械学習ソフトウェア開発

初心者向け解説: CodeGemmaを使ったAI数学オリンピックコンペのベースラインノートブック

はじめにこのノートブックは、lua-cgemmaというライブラリを使用しています。lua-cgemmaは、gemma.cppのLuaバインディングを提供するライブラリです。gemma.cppは、Google Highway Libraryを...

2024.05.02

AI・機械学習チュートリアルデータサイエンス競技プログラミング

言語モデルにおける思考連鎖推論の自己整合性の向上 (Self-Consistency Improves Chain of Thought Reasoning in Language Models)

要旨 (Abstract):大規模な事前学習済み言語モデルと思考連鎖プロンプティング(chain-of-thought prompting)を組み合わせることで、複雑な推論タスクにおいて励みになる結果が得られています。本論文では、新しいデコ...

2024.04.27

AI・機械学習大規模言語モデル自然言語処理

Pythonを使った数学問題の自動生成: データ拡張テクニック集

Pythonを使った数学問題の自動生成: データ拡張テクニック集データサイエンスにおいて、質の高いデータを大量に用意することは重要ですが、データが不足している場合もあります。そこで、データ拡張（Data Augmentation）の手法を用...

2024.04.27

AI・機械学習Pythonデータサイエンスデータ拡張

CodeGemma – Googleが開発したコード特化の大規模言語モデル

CodeGemmaの概要CodeGemmaとは？Googleが開発したコード特化の大規模言語モデル(LLM)Gemmaモデルをベースに、追加で5000億トークンの英語データ、数学、コードを学習コードの補完や生成に特化し、論理的・数学的な推論...

2024.04.26

AIコード生成AI・機械学習大規模言語モデル

JAXとWandbとSelf-Consistencyを使ったGemma Instruct 2Bモデルのファインチューニング入門

このノートブックでは、Kaggleの"AI Mathematical Olympiad"コンペティションに向けて、JAXをバックエンドに使用してGemma Instruct 2Bモデルをファインチューニングする方法を解説します。また、Wei...