maki

API連携

ワンパンでOpenAI APIをGemini Proにつなぐ【Gemini-OpenAI-Proxy】

Gemini-OpenAI-Proxyは、OpenAI APIプロトコルをGoogle Gemini Proプロトコルに変換するためのプロキシです。これにより、Gemini Proプロトコルを使用するアプリケーションにOpenAIが提供する...
チュートリアル

VMagicMirrorに命を吹き込む Pythonと Style-Bert-VITS2で リアルタイム感情表現

このチュートリアルでは、Pythonを使用してVMagicMirrorにモーションを付与する方法を説明します。VMagicMirrorは、キーボード入力とモーションを連動させることができるソフトウェアです。このプロセスでは、感情分析を行い、...
チュートリアル

AIキャラクター実況をStyle-Bert-VITS2とVMagicMirrorで始めよう

AI技術の進歩により、誰でも簡単に自分のバーチャルキャラクターを作成し、リアルタイムで実況や配信を行うことが可能になりました。この記事では、AI音声合成技術のStyle-Bert-VITS2と、バーチャルキャラクター操作ツールのVMagic...
AI音声合成

「PokéLLMon」をAIで実況してみた【Style-Bert-VITS2】

近年、ゲームの実況はただの趣味から一つのカルチャーへと進化しました。特に、AI技術を駆使してゲームの実況を行うことは、視聴者に新鮮な体験を提供します。この記事では、戦術バトルゲームで人間並みのパフォーマンスを達成した最初のLLM体現エージェ...
チュートリアル

【Dockerでワンパン】PokéLLMonを動かしてみる

PokéLLMonは、ポケモンバトルのゲームにおいて、人間並みのパフォーマンスを実現する最初のLLM(Large Language Model)を体現したエージェントです。この記事では、PokéLLMonを実際に動かすための手順を初心者向け...
大規模言語モデル

【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵...
M5Stack

M5Stackのセットアップ方法

M5Stackを使い始める前に、正しいセットアップが必要です。この記事では、M5Stackのセットアップ手順を詳しく説明します。M5Stackを効果的に活用するために、以下の手順に従ってください。USBドライバーのインストールM5Stack...
AI・機械学習

YOLO-WorldをGoogle Colabで動かしてみた

近年の技術進歩により、画像認識技術は目覚ましい発展を遂げています。その中でも、「You Only Look Once(YOLO)」シリーズは、その高速性と実用性で広く認知されています。しかし、従来のYOLOは予め定義されたカテゴリーに基づい...
モバイルアプリ開発

ボルダリングの壁を3Dスキャンする:RealityScanとiPhone 14 Proを使った方法

ボルダリング愛好家や施設運営者にとって、壁の複雑な形状をデジタル化して共有・分析することは、トレーニング方法の革新や施設のプロモーションにおいて大きな可能性を秘めています。この記事では、最新の技術を駆使してボルダリングの壁を3Dスキャンする...
Discord Bot

GASとDiscordを繋いでみた

はじめに最近、GAS(Google Apps Script)とDiscordを組み合わせることによって、ビジネスやコミュニティ内でのコミュニケーションがより効率的で革新的になっています。この記事では、GASを使ってDiscordをどのように...