Framework

AGI

Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう

はじめに近年、ChatGPTに代表される大規模言語モデル(LLM: Large Language Model)を利用したサービスが大きな注目を集めています。LLMを使えば自然言語での対話を通じて、プログラミングやデータ分析などの複雑なタスク...
AI

Claude での関数呼び出し入門

こんにちは!この記事では、Claude を使って外部の関数を呼び出す方法について、初心者向けに丁寧に解説します。関数呼び出しを使うと、Claude の機能を拡張し、より多様なタスクを実行できるようになります。こちらの記事もおすすめなんJ ア...
AI

Android端末でOpen Interpreterを使用する方法

Android端末で高性能なAIアシスタントを使いたいと思ったことはありませんか?Open Interpreterを使えば、ChatGPTのようなAIとAndroid端末上で直接対話することができます。この記事では、Android端末へのO...
AI実況

OwlWhisper: 初心者向けのキャラクターエージェント

はじめにOwlWhisperは、高速な音声認識ライブラリ「Faster Whisper」と、高品質な音声合成ライブラリ「Style-Bert-VITS2」を組み合わせたプロジェクトです。初心者でも簡単に音声認識と音声合成を体験できるように設...
LLM

大規模マルチモーダルモデル(Large Multi-Modal Models、以下LMMs)における視覚言語調整を促進するための足場座標(Scaffolding Coordinates)

概要最先端の大規模マルチモーダルモデル(LMMs)は、視覚言語タスクで優れた能力を示してきました。しかし、高度な機能にもかかわらず、複数レベルの視覚情報を用いた複雑な推論が必要とされる難しいシナリオでは、LMMsのパフォーマンスはまだ限られ...
claude

Manim-Examples-Docker

この記事では、Dockerを使用してManimでアニメーションを作成するための例と手順について説明します。こちらの記事もおすすめManimとはPythonベースPythonの知識があれば比較的簡単にアニメーションを作成できます。Python...
claude

【GoogleColabノートブック付】claude3を使用してスライドムービー作ってみた

こちらの記事もおすすめ内容の要約プロンプト下記リポジトリを初心者でも分かるように解説して出力このリポジトリは「Petals」というプロジェクトのソースコードが含まれています。Petalsは、大規模な言語モデル(LLM)を複数のコンピュータで...
AI実況

Style-Bert-VITS2をDockerでワンパン構築してみた

Style-Bert-VITS2は、音声合成モデルの一つで、カクテルストア音声に似た自然な音声を生成できるモデルです。この記事では、Dockerを使ってStyle-Bert-VITS2を構築する方法を丁寧に解説します。こちらの記事もおすすめ...
LLM

【Fate・東方ネタで学ぶ】LangChain の Tavily Search API を使ってみる【GooggleColabノートブック付】

はじめに最近のAI技術の進化に伴い、LangChain と Tavily Search API が注目されています。この記事では、LangChain の枠組みと Tavily Search API の特徴に焦点を当て、初心者向けに簡潔に解説...