Deep Learning

AI実況

DockerでStyle-Bert-VITS2 APIを簡単構築し音声合成を体験しよう【ワンパン構築】

Dockerを使って、AI音声合成のプロジェクト「Style-Bert-VITS2」のAPIを簡単に構築し、実際に動かしてみましょう。この記事では、初心者の方でも理解できるように、コードブロックを交えて解説します。PythonとDocker...
LLM

WindowsでNVIDIA ChatWithRTX Demoを動かしてみた

今日のデジタル時代では、AI技術が日常生活のあらゆる面で重要な役割を果たしています。NVIDIAは、Chat with RTXという革新的なデモアプリを通じて、この技術の進化に一層貢献しています。この記事では、Chat with RTXの概...
Gemini-OpenAI-Proxy

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...
Gemini-OpenAI-Proxy

OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロックを使用して、その手順を詳しく解説していきます。Py...
Gemini-OpenAI-Proxy

ワンパンでOpenAI APIをGemini Proにつなぐ【Gemini-OpenAI-Proxy】

Gemini-OpenAI-Proxyは、OpenAI APIプロトコルをGoogle Gemini Proプロトコルに変換するためのプロキシです。これにより、Gemini Proプロトコルを使用するアプリケーションにOpenAIが提供する...
AI実況

AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

AI技術の進歩により、誰でも簡単に自分のバーチャルキャラクターを作成し、リアルタイムで実況や配信を行うことが可能になりました。この記事では、AI音声合成技術のStyle-Bert-VITS2と、バーチャルキャラクター操作ツールのVMagic...
AGI

「PokéLLMon」をAIで実況してみた【Style-Bert-VITS2】

近年、ゲームの実況はただの趣味から一つのカルチャーへと進化しました。特に、AI技術を駆使してゲームの実況を行うことは、視聴者に新鮮な体験を提供します。この記事では、戦術バトルゲームで人間並みのパフォーマンスを達成した最初のLLM体現エージェ...
AGI

【Dockerでワンパン】PokéLLMonを動かしてみる

PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、PokéLLMonを実際に動かすための手順を初心者向け...
OpenClimbAI

ボルダリングの壁を3Dスキャンする:RealityScanとiPhone 14 Proを使った方法

ボルダリング愛好家や施設運営者にとって、壁の複雑な形状をデジタル化して共有・分析することは、トレーニング方法の革新や施設のプロモーションにおいて大きな可能性を秘めています。この記事では、最新の技術を駆使してボルダリングの壁を3Dスキャンする...
Wedding×IT

【Wedding×IT】(ぱーと6)これがAI最先端の技術を駆使した結婚式の招待状の「AR返信アート」

結婚式の招待状といえば、伝統的な紙のカードを思い浮かべるかもしれません。しかし、テクノロジーの進化は、この古典的な概念を一新しました。特に、招待状のデザインと受け取り方に革命をもたらすのが、AR(拡張現実)技術を活用した「AR返信アート」で...