AIエージェント OSWorld: オープンエンドなタスクのためのマルチモーダルエージェントのベンチマーク はじめにOSWorldは、実際のコンピュータ環境でオープンエンドなタスクを実行するマルチモーダルエージェントのベンチマークです。このリポジトリでは、環境、ベンチマーク、プロジェクトページが提供されています。主な特徴は以下の通りです:実際のデ... 2024.04.13 AIエージェントベンチマークマルチモーダル