【日本語訳】OpenCodeInterpreter: コード生成、実行、および改善の統合

Python

OpenCodeInterpreter: コード生成、実行、および改善の統合

OpenCodeInterpreter

[🏠ホームページ]
|
[🛠️コード]



こちらの記事もおすすめ

OpenCodeInterpreter:データ収集用 Local-Code-Interpreter README【日本語版】
OpenAIのChatGPTコードインタープリター(高度なデータ分析)のローカル実装です。OpenCodeInterpreterのデータ収集用に調整されていますOpenCodeInterpreterリリース待ち。。。紹介OpenAIのコード...

🌟 近日中の新機能

  • 💡 OpenCodeInterpreter-SC2シリーズモデル(StarCoder2ベース)のオープンソーシング
  • 💡 gemma-7bベースのOpenCodeInterpreter-GM-7bモデルのオープンソーシング

🔔ニュース

🛠️[2024-02-29]: 公式オンラインデモをHuggingFace Spacesにデプロイしました!デモページ をご覧ください!

🛠️[2024-02-28]: デモローカルデプロイメントコードとセットアップガイドをオープンソース化しました。

✨[2024-02-26]: OpenCodeInterpreter-DS-1.3b モデルをオープンソース化しました。

📘[2024-02-26]: CodeFeedback-Filtered-Instruction データセットをオープンソース化しました。

🚀[2024-02-23]: 当プロジェクトで使用しているデータセット、Code-Feedback をオープンソース化しました。

🔥[2024-02-19]: OpenCodeInterpreterシリーズのすべてのモデルをオープンソース化しました!皆様のモデルの試用と参加をお待ちしています!😆

紹介

OpenCodeInterpreterは、大規模な言語モデルとGPT-4コードインタープリターのような洗練された独自システムの間のギャップを埋めることを目指した、オープンソースのコード生成システムスイートです。実行機能と反復的な改善機能を統合することにより、コード生成能力を大幅に強化します。

モデル

OpenCodeInterpreterシリーズ内のすべてのモデルはHugging Faceでオープンソース化されています。以下のリンクからモデルにアクセスできます:OpenCodeInterpreterモデル

データ収集

68Kのマルチターンインタラクションを特徴とするCode-Feedbackデータセットを支えに、OpenCodeInterpreterは実行と人間のフィードバックを組み合わせて動的なコード改善を取り入れています。
データ収集手順の詳細については、データ収集 のreadmeをご覧ください。

評価

当社の評価フレームワークは主にHumanEvalとMBPP、およびそれらの拡張バージョンであるHumanEval+とMBPP+を使用し、より包括的な評価のためにEvalPlusフレームワーク を活用しています。
特定の評価方法論については、評価README を参照してください。

デモ

私たちは、ユーザーが当社のLLMをローカルでコードを生成し実行できるオープンソースのデモを提供することを嬉しく思います。デモ内では、ユーザーはLLMの力を活用してコードを生成し、ローカルで実行し、自動実行フィードバックを受け取ることができます。LLMはこのフィードバックに基づいてコードを動的に調整し、よりスムーズなコーディング体験を実現します。さらに、ユーザーはLLMモデルとのチャットベースのインタラクションを通じてフィードバックを提供し、生成されたコードをさらに強化することができます。

デモを探索し、その機能を直接体験するには、OpenCodeInterpreterデモREADME ファイルに記載されている指示に従ってください。ハッピーコーディング!

クイックスタート

  • ワークスペースに入る :
git clone https://github.com/OpenCodeInterpreter/OpenCodeInterpreter.git
cd demo
  • 新しいconda環境を作成する : conda create -n demo python=3.10
  • 作成したデモ環境をアクティブにする : conda activate demo
  • 必要なパッケージをインストールする : pip install -r requirements.txt
  • という特定のリポジトリにコンテンツを作成しプッシュするだけです。このデモをご自身のデバイスにデプロイした場合、私たちはあなたのデータにアクセスできません。
  • アクセストークンを環境変数に追加する: export HF_TOKEN="your huggingface access token"
  • Gradioアプリを実行する :
python3 chatbot.py --path "the model name of opencodeinterpreter model family. e.g., m-a-p/OpenCodeInterpreter-DS-6.7B"

動画

https://github.com/OpenCodeInterpreter/OpenCodeInterpreter/assets/46103100/2337f34d-f5ed-4ecb-857b-3c2d085b72fd

お問い合わせ

ご質問がある場合は、issueを立てるか、[xiangyue.work@gmail.com]() 、[zhengtianyu0428@gmail.com]() までメールでお問い合わせください。
お手伝いさせていただきます!

スター履歴

日本語版リポジトリ

GitHub - Sunwood-ai-labs/OpenCodeInterpreter at jp
Contribute to Sunwood-ai-labs/OpenCodeInterpreter development by creating an account on GitHub.

コメント

タイトルとURLをコピーしました