大規模言語モデル OneDiffusion:多彩な拡散モデルによる画像生成・理解タスクへの対応(GoogleColab付) はじめに本ノートブックでは、OneDiffusionと呼ばれる汎用的な大規模拡散モデルについて紹介します。このモデルは、多種多様な画像生成・画像理解タスクに双方向的(テキスト→画像、画像→記述、画像編集など)に対応することを目指して設計され... 2024.12.12 大規模言語モデルAI画像生成
大規模言語モデル Unslothを使った高速なLlama 3.2ファインチューニング入門 (📒ノートブック付) はじめにUnslothは、LLM(大規模言語モデル)のファインチューニングを大幅に高速化するライブラリーです。従来の手法と比較して約2倍の速度向上を実現し、メモリ使用量も削減できます。この記事では、Llama 3.2モデルを例に、Unslo... 2024.10.28 大規模言語モデル機械学習
AI・機械学習 vLLMとPagedAttentionについて語るスレ はじめに大規模言語モデル(LLM)の世界で、効率的な推論は常に課題となっています。この記事では、その課題に革新的なソリューションを提供する「vLLM」と「PagedAttention」について詳しく解説します。これらの技術が、どのようにLL... 2024.08.13 AI・機械学習大規模言語モデル
大規模言語モデル vLLMとPagedAttention:LLM推論の革新的技術 vLLMとPagedAttention:LLM推論の革新的技術はじめに大規模言語モデル(LLM)の世界で、効率的な推論は常に課題となっています。この記事では、その課題に革新的なソリューションを提供する「vLLM」と「PagedAttenti... 2024.08.13 大規模言語モデル人工知能
大規模言語モデル LiteLLMで無料Gemini+gpt-4o-mini+Haiku+sonnet3.5のParallel Function Callingを試す はじめにこんにちは!今回は、LiteLLMライブラリを使って、GoogleのGemini Pro、OpenAIのgpt-4-o-mini、AnthropicのClaude 3.5 sonnet、Claude 3 haikuといった複数のモデ... 2024.08.04 大規模言語モデルPython開発AI・機械学習
AI・機械学習 Gemma 2 2Bモデルの分散ファインチューニング: TPUを活用した効率的な学習方法(kaggleノート付) はじめにこんにちは!今回は、Googleが新しくリリースしたGemma 2 2Bモデルを使って、TPU(Tensor Processing Unit)を活用した分散ファインチューニングを行う方法をご紹介します。この記事は、大規模言語モデル(... 2024.08.01 AI・機械学習大規模言語モデル
大規模言語モデル GPUStack:オープンソースGPUクラスターマネージャーの完全ガイド はじめに人工知能(AI)と機械学習(ML)の急速な発展に伴い、大規模言語モデル(LLM)の需要が高まっています。しかし、これらのモデルを効率的に実行し管理することは、多くの組織にとって課題となっています。ここで登場するのが、GPUStack... 2024.07.28 大規模言語モデルAI開発ツール
AI開発 【驚愕のコスパ】LLaMa 3.1 405B を 8B に変換!Google Colab で簡単実装 このガイドでは、高品質を維持しながらコストを大幅に削減できる、LLaMa 3.1 405B から LLaMa 3.1 8B への変換方法をステップバイステップで解説します。OctoAI inference を使用するため、OctoAI のア... 2024.07.28 AI開発チュートリアル大規模言語モデル
大規模言語モデル LLaMA 3.1モデルを使ったAIチャットボットの作成:初心者向けガイド はじめにこの記事では、Meta社が開発した最新の大規模言語モデル「LLaMA 3.1」を使って、AIチャットボットを作成する方法を解説します。LLaMA 3.1は多言語対応の強力なモデルで、様々なタスクに適用できます。今回は、海賊風に話すチ... 2024.07.28 大規模言語モデルAIチャットボット開発
AI・機械学習 Meta Llama 3.1 8Bモデルを使った自然言語処理:初心者のための完全ガイド(📒Kaggleノートブック付) はじめにこんにちは!この記事では、Meta社が開発した最新の大規模言語モデル「Llama 3.1 8B」の使い方を、初心者の方にも分かりやすく解説します。自然言語処理の世界に一歩踏み出す準備はできていますか?一緒に学んでいきましょう!目次L... 2024.07.25 AI・機械学習大規模言語モデルPython開発ナチュラルランゲージプロセッシング