Python開発

Python開発

Claude Computer Use Demo – エージェントループの詳細解説

エージェントループの概要エージェントループ(loop.py)は、Computer Use Demoの中核となるコンポーネントです。このモジュールは、以下の重要な役割を担っています:Claude APIとの通信制御ツールの実行管理メッセージの...
Python開発

x.inferをGoogle Colabで試してみた!(Googleノートブック付)

はじめに最近、新しい画像認識モデルが次々とリリースされていますよね。例えばGPT-4V やClaude 3 など、画像認識の性能は日々進化しています。でも、こんな悩みはありませんか?🤔 新しいモデルを試したいけど、セットアップが面倒😅 異な...
AIエージェント

Swarm Weather Agent: 天気情報を提供するインテリジェントなエージェント

はじめにSwarm Weather Agentは、OpenAIのSwarmフレームワークを使用して構築された、インテリジェントな天気情報提供エージェントです。このプロジェクトは、単一のエージェントが複数の機能を持ち、ユーザーとのインタラクテ...
AIエージェント

OpenAI Swarm : トリアージエージェントの実装

このプロジェクトは、ユーザーの入力を適切なエージェントに振り分けるトリアージエージェントを含むSwarmの実装例です。主に3つのエージェント(トリアージ、販売、返金)が相互に連携して動作します。プロジェクトの構成プロジェクトは以下のファイル...
音声合成

open-notebooklmのソースコード解説

open-notebooklm は、PDFファイルやウェブページのテキスト内容をもとに、ポッドキャスト形式の音声ファイルを生成するオープンソースプロジェクトです。オープンソースのAIモデル(Llama 3.1 405B、MeloTTS、Ba...
チュートリアル

Ideogram API Sandboxチュートリアル:画像生成スクリプトの詳細解説

はじめにIdeogram API Sandboxは、Ideogram APIを使用してAI画像生成を簡単に試すことができるプロジェクトです。このチュートリアルでは、ideogram_api_example.pyとideogram_v2tur...
Python開発

LlamaIndexのOpenAI Pydantic Program:構造化データ生成方法

はじめにOpenAIの新しいAPIを使用して、LlamaIndexを介して構造化データを生成する方法を紹介します。このガイドでは、ユーザーがPydanticオブジェクトを指定するだけで、簡単に構造化データを抽出できることを示します。主に以下...
Python開発

FLUXをComfyUIのAPIからPythonで使用する方法

はじめにComfyUIは強力な画像生成ツールであり、FLUXモデルはその中でも特に注目される新しいモデルです。この記事では、Pythonスクリプトを使用してComfyUI FLUXモデルをAPIで呼び出し、画像を生成する方法を解説します。P...
AI・機械学習

LiteLLMで無料Gemini+gpt-4o-mini+Haiku+sonnet3.5のParallel Function Callingを試す

はじめにこんにちは!今回は、LiteLLMライブラリを使って、GoogleのGemini Pro、OpenAIのgpt-4-o-mini、AnthropicのClaude 3.5 sonnet、Claude 3 haikuといった複数のモデ...
チュートリアル

LiteLLMでAnthropicのParallel Function Callingを試す

はじめにこんにちは!今回は、LiteLLMライブラリを使って、Anthropicの最新モデルであるClaude 3.5 sonnetのパラレル関数呼び出し(Parallel Function Calling)機能を試してみます。この記事は、...