API連携

VTube StudioとPython連携してモーション発動させてみた

バーチャルYouTuber(VTuber)の世界では、配信や動画の中でキャラクターを動かすために様々な技術が用いられています。その中でも、VTube Studioはリアルタイムでのアバター制御に特化したアプリケーションとして広く利用されてい...
チュートリアル

VS Code Continue と Geminiを使った 無料AIエディタ~使ってみた編①~

導入(Introduction)Continue(コンティニュー)とは? Continueは、VS Code(VSコード)とJetBrains(ジェットブレインズ)向けのオープンソースの自動操縦機能(autopilot)です。これは、任意の...
チュートリアル

VS Code Continue と Gemini(gemini-openai-proxy) を使った無料AIエディタ

開発者の間で、コーディング作業にChatGPTなどのAIを活用する動きが加速しています。しかし、これまではAIからの回答をコードベースに組み込むために、多くのコピーアンドペーストや編集作業が必要とされ、手間がかかっていました。そこで、VS ...
大規模言語モデル

PCを初期化してからLLMのリモート開発環境(LLaMA-Factory)を構築するまで

PCの初期化から始まり、LLM(大規模言語モデル)の開発環境を構築する過程は、初心者にとっても分かりやすいように段階を追って説明します。このプロセスには、必要なソフトウェアのインストールからSSH環境のリモート開発構築、そしてセキュリティ対...
AIアシスタント

Gemini-OpenAI-ProxyでOllamaとGemini Proを簡単接続

この記事では、OllamaのOpenAI APIに接続できる機能を活用して、Gemini-OpenAI-Proxyを通じてOpenAI APIのフォーマットをGeminiのフォーマットに変換し、Gemini Proと対話する方法について解説...
AI・機械学習

Gemini 1.5登場: Googleの革新的AIが拓く100万トークンの未来

2024年2月15日この文書では、大幅に向上したパフォーマンスと、モダリティを超えた長文理解における革新的な進歩を提供する新しい世代のモデル「Gemini 1.5」について紹介します。サンダー・ピチャイとデミス・ハサビスからのメッセージサン...
AI音声合成

DockerでStyle-Bert-VITS2 APIを簡単構築し音声合成を体験しよう【ワンパン構築】

Dockerを使って、AI音声合成のプロジェクト「Style-Bert-VITS2」のAPIを簡単に構築し、実際に動かしてみましょう。この記事では、初心者の方でも理解できるように、コードブロックを交えて解説します。PythonとDocker...
大規模言語モデル

WindowsでNVIDIA ChatWithRTX Demoを動かしてみた

今日のデジタル時代では、AI技術が日常生活のあらゆる面で重要な役割を果たしています。NVIDIAは、Chat with RTXという革新的なデモアプリを通じて、この技術の進化に一層貢献しています。この記事では、Chat with RTXの概...
倫理ハッキング

サイバーセキュリティ入門 (Introduction to Cybersecurity)【TryHackMe】

サイバーセキュリティ入門 (Introduction to Cybersecurity)サイバーセキュリティは、常に善良なハッカー(ホワイトハット)と悪意のあるハッカー(ブラックハット)の間の競争です。サイバー世界の脅威が進化するにつれて、...
AI・機械学習

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...