Docker

LLM

AnyGPTをDockerで簡単に実行する方法

はじめにAnyGPTは、音声、テキスト、画像、音楽など様々なモダリティを統一的に処理できるマルチモーダル言語モデルです。この記事では、Dockerを使ってAnyGPTを簡単に実行する方法を初心者向けに解説します。AnyGPTとはAnyGPT...
LLM

LiteLLM Docker Proxyで無料のGeminiを使い倒そう!

はじめにLiteLLM Proxyは、100以上のLarge Language Models (LLMs)を統一されたインターフェースで呼び出すことができるプロキシサーバーです。仮想キーやユーザーごとに支出を追跡し、予算を設定する機能も備え...
LLM

LiteLLMのDockerセットアップ

LiteLLMは、OpenAI形式を使用してすべてのLLM APIを呼び出すことができるツールです。このガイドでは、初心者でも理解できるように、LiteLLMをDockerを使用してセットアップする方法を丁寧に説明します。こちらの記事もおす...
AI

【日本語版】MusicHiFi: Fast High-Fidelity Stereo Vocoding

要旨(Abstract)この論文では、MusicHiFiという新しい高速かつ高品質なステレオボーコーディング手法を提案しています。MusicHiFiは、低解像度の音声表現(メルスペクトログラムなど)から音声を生成し、位相再構成モデルやボーコ...
AI

Android端末でOpen Interpreterを使用する方法

Android端末で高性能なAIアシスタントを使いたいと思ったことはありませんか?Open Interpreterを使えば、ChatGPTのようなAIとAndroid端末上で直接対話することができます。この記事では、Android端末へのO...
claude

【claude3】YlvaVisionAPI(Webカメラからリアルタイムの画像を取得+ブロードキャストするためのAPI)

こちらの記事もおすすめYlvaVisionAPIYlvaVisionAPIは、Webカメラからリアルタイムの画像を取得し、ブロードキャストするためのAPIです。このREADMEでは、APIの機能、セットアップ方法、使用方法について説明します...
AI実況

Style-Bert-VITS2をDockerでワンパン構築してみた

Style-Bert-VITS2は、音声合成モデルの一つで、カクテルストア音声に似た自然な音声を生成できるモデルです。この記事では、Dockerを使ってStyle-Bert-VITS2を構築する方法を丁寧に解説します。こちらの記事もおすすめ...
AI実況

WSL+DockerでPulseAudioを使用して音を出す方法

Windows Subsystem for Linux (WSL)とDockerを使用して、Linux環境で音声アプリケーションを動作させる方法を紹介します。この記事では、PulseAudioを利用して音を出す手順について、初心者にも分かり...
AI実況

WSLでPulseAudioを使用して音を出す方法

Windows Subsystem for Linux (WSL)は、Windows上でLinuxのバイナリ実行ファイルを直接実行できる強力な機能です。しかし、WSLでは音声の再生が直接サポートされていないため、外部ソフトウェアを使用してこ...