maki

画像生成

顔写真に命を吹き込むAI「Hallo」アプリの使い方を解説!

顔写真が歌って踊る!? 最新AI「Hallo」を使えば、まるで魔法のように、静止画の顔写真に動きをつけて、音声に合わせてアニメーション動画を作ることができます。この記事では、Halloを動かすために必要なDockerのインストールから、Ha...
セキュリティ

VMwareのLinuxゲストOSで起動時にOpenVPNを自動接続する方法

はじめに前回の記事では、VMwareを使用している方で、LinuxゲストOSとホストOS間でフォルダを共有する方法を説明しました。今回は、LinuxゲストOSで起動時にOpenVPNを自動的に接続する方法をご紹介します。OpenVPNは、オ...
クラウド・サーバー

VMwareのLinuxゲストOSで共有フォルダを自動マウントする方法

はじめにこんにちは。今回は、VMwareを使用している方で、LinuxゲストOSとホストOS間でフォルダを共有したい方に向けて、共有フォルダを起動時に自動的にマウントする方法をご紹介します。VMwareは、仮想化ソフトウェアの一つで、複数の...
チュートリアル

初心者でもすぐにできる!HalloでAI肖像画像アニメーションを作ろう

はじめにこんにちは!今回は、Halloを使って音声から肖像画像のアニメーションを生成する方法を初心者向けに解説します。HalloはHierarchical Audio-Driven Visual Synthesisの略で、音声からリアルな表...
クラウド・サーバー

Google ColabにTailscaleを用いてSSH接続する方法

Google ColabにTailscaleを用いてSSH接続する方法はじめにGoogle Colabは、機械学習やデータ分析に役立つクラウドベースのJupyter Notebook環境です。このチュートリアルでは、TailscaleのVP...
AI・機械学習

RecurrentGemma 日本語版README

RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合...
AI・機械学習

Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付)

こんにちは!今回は、Flaxを使用して2Bグリフィンモデルをシンプルな翻訳タスクにファインチューニングする方法を学びます。グリフィンモデルは強力な言語モデルで、ファインチューニングによって特定のタスクに適応させることができます。初心者の方に...
AI・機械学習

Google Colab上でStable Diffusion 3をDiffusersで動かしてみよう

こんにちは!今回は、Stability AIから最新のStable Diffusionモデルである「Stable Diffusion 3」が発表されました。このモデルは、Hugging Face HubでDiffusersライブラリを使って...
AI・機械学習

Hugging Face AccelerateによるFSDPとDeepSpeedの比較と使い分け方

はじめに近年、大規模言語モデルの学習には多くのGPUリソースが必要とされています。そこで登場したのが、Zero Redundancy Optimizer (Zero)アルゴリズムを実装したDeepSpeedとPyTorch FSDPの2つの...
チュートリアル

【初心者向け】Stable Diffusion 3とComfyUIでUltraSharpを使った画像のアップスケーリング方法

はじめに前回の記事では、Stable Diffusion 3 MediumとComfyUIを使って高品質な画像を生成する方法を紹介しました。今回は、生成した画像をさらに高解像度化するための方法を解説します。具体的には、UltraSharpと...