画像生成

画像生成

PyGiCo 解説:ブログから画像を生成する魔法

PyGiCo は、ブログ記事の内容を分析し、その内容に合った画像を自動で生成してくれる、まるで魔法のようなツールです。しかも、生成した画像に好きなテキストを追加することもできます。この解説では、PyGiCo がどのような仕組みで動いているの...
AI・機械学習

画像生成AIにブレイクスルー!AutoregressiveモデルとDiffusionを組み合わせた新手法

はじめに画像生成AIの現状と課題近年、人工知能(AI)技術の発展に伴い、高品質な画像を自動生成するAIモデルが注目を集めています。しかし、既存の手法には、生成速度や画質の面で課題がありました。本論文の概要と意義本論文では、Autoregre...
AI・機械学習

顔写真に命を吹き込むAI「Hallo」アプリの使い方を解説!

顔写真が歌って踊る!? 最新AI「Hallo」を使えば、まるで魔法のように、静止画の顔写真に動きをつけて、音声に合わせてアニメーション動画を作ることができます。この記事では、Halloを動かすために必要なDockerのインストールから、Ha...
AI・機械学習

Google Colab上でStable Diffusion 3をDiffusersで動かしてみよう

こんにちは!今回は、Stability AIから最新のStable Diffusionモデルである「Stable Diffusion 3」が発表されました。このモデルは、Hugging Face HubでDiffusersライブラリを使って...
画像生成

V-Express: 条件付きドロップアウトによるポートレート動画生成の段階的トレーニング (V-Express: Conditional Dropout for Progressive Training of Portrait Video Generation)

論文の概要この論文は、シングル画像からポートレート動画を生成するための新しい手法V-Expressを紹介します。V-Expressは、異なる強度の制御信号(テキスト、音声、参照画像、ポーズ、深度マップなど)をバランス良く扱うことで、高品質な...
画像生成

1枚の画像から話す動画を作る「V-Express」の仕組みと使い方

はじめにポートレートビデオ生成とは、1枚の画像からその人物が話している動画を作ることです。これまでの手法では、次のような課題がありました。テキスト、音声、ポーズなどの制御信号のバランスを取るのが難しい特に音声の影響が他の信号に隠れてしまいが...
チュートリアル

《Hidiffusion》img2imgノートブック

ステップ0: 環境の準備このステップでは、必要なライブラリをインストールし、環境を設定します。このステップは、実際にローカル環境やColabで実行する際に最初に行う必要があります。!cd /content!pip install -q hi...