maki

Python開発

Claude Computer Use Demo – エージェントループの詳細解説

エージェントループの概要エージェントループ(loop.py)は、Computer Use Demoの中核となるコンポーネントです。このモジュールは、以下の重要な役割を担っています:Claude APIとの通信制御ツールの実行管理メッセージの...
機械学習

x.inferをGoogle Colabで試してみた!(Googleノートブック付)

はじめに最近、新しい画像認識モデルが次々とリリースされていますよね。例えばGPT-4V やClaude 3 など、画像認識の性能は日々進化しています。でも、こんな悩みはありませんか?🤔 新しいモデルを試したいけど、セットアップが面倒😅 異な...
AIアプリケーション開発

Anthropic Claude の Computer Use Demo を解剖する:仮想世界を操るAIエージェント

この記事では、Anthropic社の提供するcomputer-use-demo-jpリポジトリを徹底的に解剖し、その構造、機能、そしてコードの詳細まで踏み込んで解説します。Claude 3.5 Sonnetの"computer use"機能...
AIアプリケーション開発

Anthropic Computer Use Demo JP: Claude 3.5 Sonnetのコンピューター使用機能を体験しよう

はじめにAnthropicが提供するClaude 3.5 Sonnetの革新的な機能の1つである「Computer Use」を簡単に試せるデモ環境が公開されました。本記事では、この日本語版デモ環境「Anthropic Computer Us...
動画処理

Hallo2を使って音声駆動の長時間高解像度ポートレート画像アニメーションを作成する方法

はじめにHallo2は、音声入力に基づいて長時間かつ高解像度のポートレート画像アニメーションを生成できる最新のAI技術です。この記事では、Hallo2モデルをダウンロードし、Dockerを使って環境を構築し、実際に動かす方法を詳しく解説しま...
オープンソース

Bolt.new アプリケーションの構造と機能解説

はじめにこのドキュメントは、Bolt アプリケーションのコードベースの構造と各部の機能について解説します。Bolt は、StackBlitz の WebContainer API を活用し、ブラウザ上でフルスタック Web アプリケーション...
AI・機械学習

AI駆動要件定義とは何か?

AI駆動要件定義とは何か?はじめに近年、「AI」や「生成AI」といった言葉がビジネスシーンや日常生活で頻繁に聞かれるようになりました。しかし、これらが具体的に何を意味し、どのように活用されているのかを詳しく知っている人は少ないかもしれません...
ソフトウェア開発

claude.aiとclineを活用したコストと精度を両立するAI駆動開発手法

はじめにAI駆動型ソフトウェア開発において、コストを抑えつつ高精度な成果物を得ることは重要な課題です。本記事では、ChatGPT やclaude.ai といったWeb UIベースのAIと、cline(旧Claude-dev) を組み合わせて...
AIアシスタント

cline (旧:Claude-dev) 向けPowerShellシステムプロンプトの開発

概要cline(旧:Claude-dev)の機能を拡張し、Windows環境でのPowerShellサポートを実現するための新しいシステムプロンプトを開発しました。この更新により、WindowsユーザーもPowerShellを通じてclin...
AIアプリケーション開発

Bolt改造:BoltにAWS Bedrockを対応させる方法

はじめにBoltは、Remix Runを用いて構築されたAI駆動の開発ツールで、ブラウザ上でのフルスタック開発を可能にします。本記事では、BoltにAWS BedrockのモデルであるClaudeを統合する方法について解説します。これにより...