AGI OSWorld: オープンエンドなタスクのためのマルチモーダルエージェントのベンチマーク はじめにOSWorldは、実際のコンピュータ環境でオープンエンドなタスクを実行するマルチモーダルエージェントのベンチマークです。このリポジトリでは、環境、ベンチマーク、プロジェクトページが提供されています。主な特徴は以下の通りです:実際のデ... 2024.04.13 AGI
AGI AutoCodeRover入門 – 自動プログラム修正ツールを動かしてみよう! こんにちは!皆さんは、プログラミングのバグ修正や機能追加に苦労したことはありませんか?そんな悩みを解決してくれる夢のようなツール「AutoCodeRover」を、今回はDocker Composeを使って手軽に動かす方法を紹介します。こちら... 2024.04.11 AGI
AGI 日本語版:AutoCodeRover: 自律的なプログラム改善 (AutoCodeRover: Autonomous Program Improvement) 概要この論文は、GitHub issues を自動的に解決し、プログラムの修正や機能追加を自律的に行うアプローチ「AutoCodeRover」を提案しています。AutoCodeRoverは、大規模言語モデル(Large Language M... 2024.04.11 AGI
AGI ろんJ 実況~論文をなんJ風に解説&実況~ 論文は難しそうで読むのが億劫だと感じたことはありませんか?でもそんな人でも、「ろんJ」を使えば論文の内容が面白おかしく理解できるかもしれません。「ろんJ」は、アップロードした論文の内容を、あの有名な2ちゃんねるの「なんでも実況J」(通称:な... 2024.03.28 AGI
AGI Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう はじめに近年、ChatGPTに代表される大規模言語モデル(LLM: Large Language Model)を利用したサービスが大きな注目を集めています。LLMを使えば自然言語での対話を通じて、プログラミングやデータ分析などの複雑なタスク... 2024.03.27 AGI
AGI ろんJ (V1.4)~論文をなんJ風に解説!専門家と初心者の活発な議論が面白い~ 論文は難しそうで読むのが億劫...。でもそんな人でも、「ろんJ GPTs」を使えば論文の内容が面白おかしく理解できるかもしれません。「ろんJ GPTs」は、アップロードした論文の内容を、あの有名な2ちゃんねるの「なんでも実況J」(通称:なん... 2024.03.27 AGI
AGI 日本語版:AIOS LLM Agent Operating System はじめに近年、大規模言語モデル(LLM)を用いた知的エージェントの開発が盛んになってきました。しかし、LLMとエージェントを効率的に統合・運用するには様々な課題があります。この論文では、LLMをオペレーティングシステム(OS)に組み込んだ「... 2024.03.27 AGI
AGI OpenCodeInterpreterのデモを触ってみた OpenCodeInterpreterは、開発者やプログラミング愛好家の間で注目を集めています。その公式デモを体験し、その機能と制約について深堀りしてみました。この記事では、m-a-p/OpenCodeInterpreter-DS-6.7B... 2024.02.29 AGI
AGI 【日本語訳】OpenCodeInterpreter: コード生成、実行、および改善の統合 OpenCodeInterpreter: コード生成、実行、および改善の統合 | こちらの記事もおすすめ🌟 近日中の新機能💡 OpenCodeInterpreter-SC2シリーズモデル(StarCoder2ベース)のオープンソ... 2024.02.29 AGI
AGI Dockerを活用してLocal-Code-Interpreterを手軽に始めよう OpenAIのChatGPTコードインタープリター(現在は高度なデータ分析として再命名されています)は、AIモデル内でPythonコードを実行する革命的な機能を提供します。しかし、この機能はオンラインのサンドボックス内でコードを実行するため... 2024.02.23 AGI