AI・機械学習

AI・機械学習

画像生成AIにブレイクスルー!AutoregressiveモデルとDiffusionを組み合わせた新手法

はじめに画像生成AIの現状と課題近年、人工知能(AI)技術の発展に伴い、高品質な画像を自動生成するAIモデルが注目を集めています。しかし、既存の手法には、生成速度や画質の面で課題がありました。本論文の概要と意義本論文では、Autoregre...
AI・機械学習

顔写真に命を吹き込むAI「Hallo」アプリの使い方を解説!

顔写真が歌って踊る!? 最新AI「Hallo」を使えば、まるで魔法のように、静止画の顔写真に動きをつけて、音声に合わせてアニメーション動画を作ることができます。この記事では、Halloを動かすために必要なDockerのインストールから、Ha...
AI・機械学習

RecurrentGemma 日本語版README

RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合...
AI・機械学習

Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付)

こんにちは!今回は、Flaxを使用して2Bグリフィンモデルをシンプルな翻訳タスクにファインチューニングする方法を学びます。グリフィンモデルは強力な言語モデルで、ファインチューニングによって特定のタスクに適応させることができます。初心者の方に...
画像生成

Google Colab上でStable Diffusion 3をDiffusersで動かしてみよう

こんにちは!今回は、Stability AIから最新のStable Diffusionモデルである「Stable Diffusion 3」が発表されました。このモデルは、Hugging Face HubでDiffusersライブラリを使って...
大規模言語モデル

Hugging Face AccelerateによるFSDPとDeepSpeedの比較と使い分け方

はじめに近年、大規模言語モデルの学習には多くのGPUリソースが必要とされています。そこで登場したのが、Zero Redundancy Optimizer (Zero)アルゴリズムを実装したDeepSpeedとPyTorch FSDPの2つの...
AI・機械学習

RecurrentGemma-9b: 革新的な自然言語処理モデルの登場

はじめに近年、自然言語処理(NLP)の分野では、大規模な言語モデルが目覚ましい進歩を遂げています。そんな中、Googleが開発したRecurrentGemmaモデルが注目を集めています。RecurrentGemmaは、従来のGemmaモデル...
AI・機械学習

《UE5.4.2》WebSocket でLLMと日本語のやり取りを実現する!:新バージョン v0.2.0 リリースノート解説

この解説記事では、Unreal Engine 5.4.2 と WebSocket を用いて、C++ と Python 間で日本語を含むメッセージのやり取りを行うサンプルプロジェクトの最新バージョン v0.2.0 のリリースノートについて解説...
AI・機械学習

SourceSage 5.0.0のクイックスタートガイド

こんにちは!SourceSage 5.0.0を使ってみたいけど、どうやって始めたらいいのかわからない…という方のために、この記事ではSourceSage 5.0.0の使い方を初心者向けに丁寧に解説していきます。一緒に学んでいきましょう!セッ...
AI・機械学習

EraserAI コード解説 – 実践的なユースケース

EraserAIは、自然言語やコードスニペットから視覚的なダイアグラムを生成する、とっても便利なツールです!この解説では、EraserAIを使って、わかりやすくダイアグラムを作成する方法を、初心者の方にもわかりやすく説明します。クラウドアー...