maki

AIアシスタント

WindowsでNVIDIA ChatWithRTX Demoを動かしてみた

今日のデジタル時代では、AI技術が日常生活のあらゆる面で重要な役割を果たしています。NVIDIAは、Chat with RTXという革新的なデモアプリを通じて、この技術の進化に一層貢献しています。この記事では、Chat with RTXの概...
セキュリティ

サイバーセキュリティ入門 (Introduction to Cybersecurity)【TryHackMe】

サイバーセキュリティ入門 (Introduction to Cybersecurity)サイバーセキュリティは、常に善良なハッカー(ホワイトハット)と悪意のあるハッカー(ブラックハット)の間の競争です。サイバー世界の脅威が進化するにつれて、...
画像認識

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...
チュートリアル

OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロックを使用して、その手順を詳しく解説していきます。Py...
API連携

ワンパンでOpenAI APIをGemini Proにつなぐ【Gemini-OpenAI-Proxy】

Gemini-OpenAI-Proxyは、OpenAI APIプロトコルをGoogle Gemini Proプロトコルに変換するためのプロキシです。これにより、Gemini Proプロトコルを使用するアプリケーションにOpenAIが提供する...
チュートリアル

VMagicMirrorに命を吹き込む Pythonと Style-Bert-VITS2で リアルタイム感情表現

このチュートリアルでは、Pythonを使用してVMagicMirrorにモーションを付与する方法を説明します。VMagicMirrorは、キーボード入力とモーションを連動させることができるソフトウェアです。このプロセスでは、感情分析を行い、...
チュートリアル

AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

AI技術の進歩により、誰でも簡単に自分のバーチャルキャラクターを作成し、リアルタイムで実況や配信を行うことが可能になりました。この記事では、AI音声合成技術のStyle-Bert-VITS2と、バーチャルキャラクター操作ツールのVMagic...
AI音声合成

「PokéLLMon」をAIで実況してみた【Style-Bert-VITS2】

近年、ゲームの実況はただの趣味から一つのカルチャーへと進化しました。特に、AI技術を駆使してゲームの実況を行うことは、視聴者に新鮮な体験を提供します。この記事では、戦術バトルゲームで人間並みのパフォーマンスを達成した最初のLLM体現エージェ...
Docker

【Dockerでワンパン】PokéLLMonを動かしてみる

PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、PokéLLMonを実際に動かすための手順を初心者向け...
大規模言語モデル

【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵...