ファインチューニング

LLMファインチューニング

WikipediaデータからLlama 3.1用Q&Aデータセット生成ツールの解説( Google Colabノートブック付)

はじめにこのツールは、Wikipediaの記事からLlama 3.1のファインチューニング用Q&Aデータセットを自動生成するためのものです。生成されたデータセットは、Llama 3.1の会話形式に準拠しており、高品質な学習データとして活用で...
大規模言語モデル

Unslothを使った高速なLlama 3.2ファインチューニング入門 (📒ノートブック付)

はじめにUnslothは、LLM(大規模言語モデル)のファインチューニングを大幅に高速化するライブラリーです。従来の手法と比較して約2倍の速度向上を実現し、メモリ使用量も削減できます。この記事では、Llama 3.2モデルを例に、Unslo...
AI・機械学習

Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開

このノートブックでは、Googleが新たにリリースした軽量ながらも高性能な言語モデル Gemma 2 2B を、日本語データセット databricks-dolly-15k-ja でファインチューニングする方法を紹介します。さらに、Kagg...
機械学習

Gemma2-2b: TPUを活用したファインチューニングとKagglehubへのアップロード

はじめにこんにちは!今回は、Googleが新しくリリースしたGemma2-2b モデルを使って、TPU(Tensor Processing Unit)を活用したファインチューニングを行い、その結果をKagglehubにアップロードする方法を...
AI開発

OpenAIクレジット2500ドルの最適な活用法:アイデアと可能性を探る

はじめにOpenAIのAPI利用クレジット2500ドルを手に入れたとき、どのように活用すれば最大の効果が得られるでしょうか?本記事では、Reddit上で議論された様々なアイデアを紹介しながら、OpenAIのクレジットを効果的に使用する方法に...
言語モデル

Google ColabとUnslothを使ってLlama 3 (8B)をファインチューニングし、Ollamaにデプロイする方法

このチュートリアルでは、UnslothとGoogle Colabを使って無料でLlama-3をファインチューニングし、独自のチャットボットを作成する方法を段階的に説明します。作成したチャットボットは、Ollamaを使ってローカルコンピュータ...
AI・機械学習

Claude 3 Haikuのファインチューニング:AI性能向上の新時代

はじめに:Claude 3 Haikuとは?Claude 3 Haikuは、AnthropicのAIモデルファミリーの一つで、高速で費用対効果の高いモデルとして知られています。このモデルは、日常的なタスクを迅速に処理することができ、ビジネス...
チュートリアル

Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付)

こんにちは!今回は、Flaxを使用して2Bグリフィンモデルをシンプルな翻訳タスクにファインチューニングする方法を学びます。グリフィンモデルは強力な言語モデルで、ファインチューニングによって特定のタスクに適応させることができます。初心者の方に...
AI・機械学習

時系列基盤amazon chronos-t5を触ってみた(Google Colab)

はじめに今回は、HuggingFaceで公開されている時系列予測用の強力なモデル「amazon chronos-t5」を使って、電力変圧器の温度予測に挑戦します!chronos-t5は、大規模な時系列データセットで事前学習された、Trans...
AI・機械学習

JAXとWandbとSelf-Consistencyを使ったGemma Instruct 2Bモデルのファインチューニング入門

このノートブックでは、Kaggleの"AI Mathematical Olympiad"コンペティションに向けて、JAXをバックエンドに使用してGemma Instruct 2Bモデルをファインチューニングする方法を解説します。また、Wei...