Python

AI音声合成

Style-Bert-VITS2で生成した音声をVTube StudioとPython連携して表情を制御してみた

最新技術を駆使して、リアルタイムでキャラクターの表情をコントロールすることは、多くのバーチャルYouTuberやストリーマーにとって非常に興味深いトピックです。この記事では、Style-Bert-VITS2で生成した音声を使い、VTube ...
Python

OpenCodeInterpreter:データ収集用 Local-Code-Interpreter README【日本語版】

OpenAIのChatGPTコードインタープリター(高度なデータ分析)のローカル実装です。OpenCodeInterpreterのデータ収集用に調整されていますOpenCodeInterpreterリリース待ち。。。紹介OpenAIのコード...
チュートリアル

VTube StudioとPython連携してモーション発動させてみた

バーチャルYouTuber(VTuber)の世界では、配信や動画の中でキャラクターを動かすために様々な技術が用いられています。その中でも、VTube Studioはリアルタイムでのアバター制御に特化したアプリケーションとして広く利用されてい...
画像認識

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...
チュートリアル

OpenAI Python APIライブラリでGemini Proを呼び出してみた【Gemini-OpenAI-Proxy】

OpenAIのPython APIライブラリを使用して、Gemini APIを呼び出す過程は、初心者にとっても分かりやすく、かつ実践的な学びを提供します。この記事では、具体的なコードブロックを使用して、その手順を詳しく解説していきます。Py...
チュートリアル

VMagicMirrorに命を吹き込む Pythonと Style-Bert-VITS2で リアルタイム感情表現

このチュートリアルでは、Pythonを使用してVMagicMirrorにモーションを付与する方法を説明します。VMagicMirrorは、キーボード入力とモーションを連動させることができるソフトウェアです。このプロセスでは、感情分析を行い、...
大規模言語モデル

【Gemini API】網羅的に学ぶ Python Quickstart 日本語版

はじめにこのコードは、GoogleのGemini APIを使用したPythonクイックスタートガイドです。Gemini APIは、Googleの大規模言語モデルにアクセスするためのPython SDKを提供します。このガイドでは、APIのセ...
Python

AIによる東方風な音楽生成:Google Music Transformerを活用した「Super Piano 3」

はじめにこのコードは、Google Music Transformerを利用して長期構造を持つ音楽を生成するためのもので、「Super Piano 3」というプロジェクトの一部です。以下、コードの各セクションについて詳細な解説をします。こち...
チュートリアル

Blender 4.0でPython APIを使用して外部の自作関数を使用する方法

はじめにこの記事では、Blender 4.0でPython APIを使用して外部の自作関数を使用する方法を説明します。このプロセスは、コマンドラインからBlenderを操作し、自動化タスクを実行する際に役立ちます。こちらの記事もおすすめ必要...
3Dモデリング

Blender 4.0でPython APIを使用して平面のメッシュに画像を貼り付ける方法

はじめにこの記事では、Blender 4.0でPython APIを使用して平面のメッシュに画像を貼り付ける方法を説明します。このプロセスは、コマンドラインからBlenderを操作し、自動化タスクを実行する際に役立ちます。こちらの記事もおす...