機械学習

LLM評価システム (LLMs as a Judge):📒Goolgeノートブック付

はじめにこのノートブックでは、LLM(大規模言語モデル)の回答品質を自動的に評価するためのシステムを実装します。このシステムは、質問、模範解答、LLMの回答を比較し、4段階のスケールで評価を行います。目的LLMの回答品質を定量的に評価する評...
AIアプリケーション開発

Company as Language (CaL): 自然言語からのAIエージェント組織の創出

はじめに:AIエージェント組織の新しいパラダイム私たちは今、AIの活用に関する新しい地平に立っています。単一のAIアシスタントではなく、複数のAIエージェントが有機的に協調する「会社」として機能させる。それが、Company as Lang...
Google Colab

LiteLLMを活用してOllamaをGoogle Colabで効率的に運用する方法 (📒ノートブック付)

はじめにローカルLLMの運用において、OllamaとLiteLLMの組み合わせは非常に強力なソリューションとなっています。本記事では、Google Colab環境でこれらのツールを効率的に統合する方法を解説します。OllamaとはOllam...
大規模言語モデル

Unslothを使った高速なLlama 3.2ファインチューニング入門 (📒ノートブック付)

はじめにUnslothは、LLM(大規模言語モデル)のファインチューニングを大幅に高速化するライブラリーです。従来の手法と比較して約2倍の速度向上を実現し、メモリ使用量も削減できます。この記事では、Llama 3.2モデルを例に、Unslo...
Python開発

Claude Computer Use Demo – エージェントループの詳細解説

エージェントループの概要エージェントループ(loop.py)は、Computer Use Demoの中核となるコンポーネントです。このモジュールは、以下の重要な役割を担っています:Claude APIとの通信制御ツールの実行管理メッセージの...
Python開発

x.inferをGoogle Colabで試してみた!(Googleノートブック付)

はじめに最近、新しい画像認識モデルが次々とリリースされていますよね。例えばGPT-4V やClaude 3 など、画像認識の性能は日々進化しています。でも、こんな悩みはありませんか?🤔 新しいモデルを試したいけど、セットアップが面倒😅 異な...
AIアプリケーション開発

Anthropic Claude の Computer Use Demo を解剖する:仮想世界を操るAIエージェント

この記事では、Anthropic社の提供するcomputer-use-demo-jpリポジトリを徹底的に解剖し、その構造、機能、そしてコードの詳細まで踏み込んで解説します。Claude 3.5 Sonnetの"computer use"機能...
AI

Anthropic Computer Use Demo JP: Claude 3.5 Sonnetのコンピューター使用機能を体験しよう

はじめにAnthropicが提供するClaude 3.5 Sonnetの革新的な機能の1つである「Computer Use」を簡単に試せるデモ環境が公開されました。本記事では、この日本語版デモ環境「Anthropic Computer Us...
動画処理

Hallo2を使って音声駆動の長時間高解像度ポートレート画像アニメーションを作成する方法

はじめにHallo2は、音声入力に基づいて長時間かつ高解像度のポートレート画像アニメーションを生成できる最新のAI技術です。この記事では、Hallo2モデルをダウンロードし、Dockerを使って環境を構築し、実際に動かす方法を詳しく解説しま...
AIアプリケーション開発

Bolt.new アプリケーションの構造と機能解説

はじめにこのドキュメントは、Bolt アプリケーションのコードベースの構造と各部の機能について解説します。Bolt は、StackBlitz の WebContainer API を活用し、ブラウザ上でフルスタック Web アプリケーション...