《数学自動生成データセット》Pythonによる数学問題のデータ拡張: 10種類の問題を自動生成

データサイエンス

description(説明の追加)

このデータセットは、Pythonを使って数学の問題を自動生成するためのサンプルコードと生成されたデータを含んでいます。元となる10種類の数学問題のテンプレートを用意し、各問題に対してパラメータをランダムに変更することで、新しい問題と解答のペアを自動的に生成しています。生成された問題は、数学のカリキュラム全般に渡る内容を扱っており、数学A、数学II、数学B、数学III、数学Cの幅広い単元と関連しています。このデータセットを使って、数学問題の自動生成や、問題の特徴分析などに活用できます。

Pythonを使った数学問題の自動生成: データ拡張テクニック集
Pythonを使った数学問題の自動生成: データ拡張テクニック集データサイエンスにおいて、質の高いデータを大量に用意することは重要ですが、データが不足している場合もあります。そこで、データ拡張(Data Augmentation)の手法を用...

file information(ファイル情報の追加)

  • aug_math_problems.csv: 自動生成された数学問題のデータセット。各行は1つの問題に対応し、問題文、解答、問題番号、関連する数学の単元、難易度が含まれています。
  • aug_math_problems.py: 数学問題を自動生成するPythonスクリプト。10種類の問題に対するデータ拡張の関数が定義されています。

column descriptors(列の説明を含める)

  • id: 問題のID
  • problem: 問題文
  • answer: 解答
  • Problem No.: 問題番号(1〜10)
  • Related Mathematical Units: 関連する数学の単元
  • Difficulty: 難易度(Standard または Mathematical Olympiad Level)

Specify provenance(出所を明記する)

このデータセットは、Kaggle の「AI Mathematical Olympiad Prize」コンペティションで提供された数学問題のデータをもとに、Pythonを使って自動生成したものです。元の問題をテンプレートとして使用し、パラメータを変更することで新しい問題を作成しました。問題の自動生成には、NumPy、pandas、SymPy、Scipyなどのライブラリを使用しています。データセットの作成には、ChatGPTの支援を受けました。

ノートブック

Pythonを使った数学問題の自動生成: データ拡張テクニック集
Explore and run machine learning code with Kaggle Notebooks | Using data from AI Mathematical Olympiad - Progress Prize 1

データセット

AIMO TRAIN Augmentation
Data Augmentation for Mathematical Problems using Python: Automatically Generati

コメント

タイトルとURLをコピーしました