環境構築

AI活用

OmniAvatar完全ガイド:Google Colabで音声駆動アバター動画を作成する方法

AI技術の急速な進歩により、音声から自然な動きのアバター動画を生成することが現実となりました。今回紹介するOmniAvatarは、まさにそんな夢のような技術を実現するシステムです。本記事では、Google Colabを使ってOmniAvat...
AIツール

📄 PDF内の画像も読み取れるAI文書処理アプリの使い方

AWS BedrockとClaude Sonnet 4を使った「bedrock_pdf_app」の使い方をご紹介します。従来のPDF処理ツールとの大きな違いは、テキストだけでなく画像・図表も理解できる点です。🔧 セットアップ方法Bedroc...
AI画像生成

Google ColabでGPT Image:猫耳・犬耳キャラクター生成クックブック

このGoogle Colabクックブックでは、GPT Imageを使用して猫耳女性や犬耳男性などのアニメ風キャラクターを生成・編集する方法を学びます。ブラウザ上で直接実行でき、高品質なキャラクターアートを作成できます。GPT Image I...
Python

Google ColabでGPT Image Input fidelityを使った画像の生成と編集

このGoogle Colabクックブックでは、画像生成機能を持つ新しい大規模言語モデルであるGPT Imageの使い方を学びます。このノートブックはGoogle Colab環境で動作し、ブラウザ上で直接実行できます。このモデルは世界に関する...
チュートリアル

Google ColabでGemma + DeepEval QA評価システム構築ガイド

Google Colabの無料環境でGemma3nモデルを使い、DeepEvalによる高度なLLM as a Judge評価を実現する完全ガイドです。複雑な設定は不要で、環境変数変更だけでプロフェッショナルなQA評価システムが構築できます。...
開発環境

🦙 Llama.cpp Docker Compose セットアップガイド

WindowsでLlama.cppを簡単に動かすためのDocker Composeセットアップです。APIサーバーによる運用が可能です。WindowsのDocker環境✖llama.cpp ✖ Gemma3nでlogprobs出力できた!!...
チュートリアル

HuggingFaceからGemma3nをダウンロードしてllama.cppで動かす(Google Colab📒ノートブック付)

HuggingFaceからGemma3nの修正済みGGUFファイルをダウンロードして、llama.cppで実行する効率的な方法です。GraphGen JP ✖ gemma3n でファインチューニングしてみる7⃣無事に、Unsloth版のGe...
Markdown

Quarkdown クイックスタートガイド

QuarkdownとはMarkdown with superpowers - Markdownを大幅に拡張したスライド・文書作成ツールです。数式、グラフ、高度なレイアウトが簡単に作成できます。前提条件Markdownの進化系「quarkdo...
API

Amazon Nova Act を体験してみた!自動ブラウザ操作の新時代

Amazonが研究プレビューとして公開している「Nova Act」を実際に試してみました。この記事では、Nova Actの特徴と実際の動作について紹介します。Nova Actとは?Nova Actは、ウェブブラウザ上で信頼性の高いアクション...
AI開発

RustのLLMフレームワークRigをRoo-cline × DeepSeek V3で試してみた!

はじめに最近注目を集めているRustのLLMフレームワーク「Rig」を、Roo-clineとDeepSeek V3を使って検証してみました。Rigは、LLMを活用したアプリケーション開発のためのスケーラブルでモジュラーなフレームワークです。...