マルチモーダル OSWorld: オープンエンドなタスクのためのマルチモーダルエージェントのベンチマーク
はじめにOSWorldは、実際のコンピュータ環境でオープンエンドなタスクを実行するマルチモーダルエージェントのベンチマークです。このリポジトリでは、環境、ベンチマーク、プロジェクトページが提供されています。主な特徴は以下の通りです:実際のデ...
マルチモーダル
ソフトウェア開発ツール
チュートリアル
未分類
AI・機械学習
AI・機械学習
日本語AI
セキュリティ
自然言語処理
Python