AIエージェント OSWorld: オープンエンドなタスクのためのマルチモーダルエージェントのベンチマーク
はじめにOSWorldは、実際のコンピュータ環境でオープンエンドなタスクを実行するマルチモーダルエージェントのベンチマークです。このリポジトリでは、環境、ベンチマーク、プロジェクトページが提供されています。主な特徴は以下の通りです:実際のデ...
AIエージェント
ベンチマーク