LoRA - Sun wood AI labs.2

無料Google Colabでできる📒 Wan2.1-T2I を使った高品質キャラクター画像生成ガイド

🚀 はじめにこのノートブックでは、Wan2.1-T2V-14BモデルとComfyUIを使用して、ハリウッド映画級の美しい妖怪キャラクターを生成する方法を解説します。Wan2.1_T2I_jupyter が無料のGoogle Colabで無事...

2025.08.23

AIツールAI動画生成生成AI開発環境

🚀 はじめにこのチュートリアルでは、OpenAIの最新モデルGPT-OSS 20BをGoogle Colab L4 GPU（22GB VRAM）でファインチューニングする方法を解説します。UnslothライブラリとLoRAを使用することで、...

2025.08.09

AI・機械学習ファインチューニング大規模言語モデル (LLM)

はじめにこのノートブックでは、医療画像分析のための大規模言語ビジョンモデル(Vision Language Model: VLM)のファインチューニングを行います。具体的には、Llama 3.2 11Bモデルを使用して、X線画像、CTスキャ...

2024.11.23

AI開発機械学習

はじめにUnslothは、LLM（大規模言語モデル）のファインチューニングを大幅に高速化するライブラリーです。従来の手法と比較して約2倍の速度向上を実現し、メモリ使用量も削減できます。この記事では、Llama 3.2モデルを例に、Unslo...

2024.10.28

大規模言語モデル機械学習

はじめにStableDiffusionユーザーの皆さん、お待たせしました！SimpleTunerの最新バージョンv0.9.8.1がついにリリースされ、Fluxモデルの微調整において画期的な進歩を遂げました。本記事では、この重要なアップデート...

2024.08.12

AI画像生成Stable Diffusion

概要Gemmaは、軽量でありながら最先端の性能を持つオープンモデルのファミリーで、Googleの研究と技術を基に構築されています。Gemmaは特定のニーズに合わせてさらにファインチューニングすることができます。しかし、Gemmaのような大規...

2024.04.23

AI・機械学習チュートリアル大規模言語モデル

AI音楽生成

全体ざっくり解説はじめにMLLMsは、テキスト、視覚、オーディオ、3Dなどの多様なモダリティをつなぐ役割を果たしています。これらのモデルは、人間の意図を理解し、画像や音楽などの出力を生成するために使用されていますが、理解と生成を統合する研究...

2024.01.09

AI音楽生成マルチモーダル論文解説