AI・機械学習 RecurrentGemma 日本語版README RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合... 2024.06.16 AI・機械学習自然言語処理日本語AI
AI・機械学習 Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付) こんにちは!今回は、Flaxを使用して2Bグリフィンモデルをシンプルな翻訳タスクにファインチューニングする方法を学びます。グリフィンモデルは強力な言語モデルで、ファインチューニングによって特定のタスクに適応させることができます。初心者の方に... 2024.06.16 AI・機械学習自然言語処理チュートリアル
AI・機械学習 Google Colab上でStable Diffusion 3をDiffusersで動かしてみよう こんにちは!今回は、Stability AIから最新のStable Diffusionモデルである「Stable Diffusion 3」が発表されました。このモデルは、Hugging Face HubでDiffusersライブラリを使って... 2024.06.14 AI・機械学習画像生成
AI・機械学習 Hugging Face AccelerateによるFSDPとDeepSpeedの比較と使い分け方 はじめに近年、大規模言語モデルの学習には多くのGPUリソースが必要とされています。そこで登場したのが、Zero Redundancy Optimizer (Zero)アルゴリズムを実装したDeepSpeedとPyTorch FSDPの2つの... 2024.06.14 AI・機械学習大規模言語モデル
大規模言語モデル RecurrentGemma-9b: 革新的な自然言語処理モデルの登場 はじめに近年、自然言語処理(NLP)の分野では、大規模な言語モデルが目覚ましい進歩を遂げています。そんな中、Googleが開発したRecurrentGemmaモデルが注目を集めています。RecurrentGemmaは、従来のGemmaモデル... 2024.06.12 大規模言語モデルAI・機械学習自然言語処理
AI・機械学習 《UE5.4.2》WebSocket でLLMと日本語のやり取りを実現する!:新バージョン v0.2.0 リリースノート解説 この解説記事では、Unreal Engine 5.4.2 と WebSocket を用いて、C++ と Python 間で日本語を含むメッセージのやり取りを行うサンプルプロジェクトの最新バージョン v0.2.0 のリリースノートについて解説... 2024.06.11 AI・機械学習ゲーム開発日本語AI
AI・機械学習 SourceSage 5.0.0のクイックスタートガイド こんにちは!SourceSage 5.0.0を使ってみたいけど、どうやって始めたらいいのかわからない…という方のために、この記事ではSourceSage 5.0.0の使い方を初心者向けに丁寧に解説していきます。一緒に学んでいきましょう!セッ... 2024.06.10 AI・機械学習チュートリアル
AI・機械学習 EraserAI コード解説 – 実践的なユースケース EraserAIは、自然言語やコードスニペットから視覚的なダイアグラムを生成する、とっても便利なツールです!この解説では、EraserAIを使って、わかりやすくダイアグラムを作成する方法を、初心者の方にもわかりやすく説明します。クラウドアー... 2024.06.09 AI・機械学習クラウド・サーバーデータサイエンス
Python Fate Stay Nightで学ぶGraphRAG(GoogleColab付) はじめにGraph retrieval augmented generation (Graph RAG) は、従来のベクター検索による情報検索手法に強力な手法として注目を集めています。Graph RAGは、データをノードと関係性で構造化する... 2024.06.07 PythonAI・機械学習データサイエンスチュートリアル
AI・機械学習 進化的モデルマージでAIモデルをパワーアップ!mergekit-evolve(GoogleColab版) 進化的なモデルマージとは、複数の言語モデルを組み合わせて、特定の能力や特性を持つ新しいモデルを作成する手法です。従来の手法では、どのモデルをどのように組み合わせるかは手探りで進める必要がありましたが、進化的なモデルマージでは、目標とする特性... 2024.06.05 AI・機械学習大規模言語モデル