データセット

【GoogleColab付】無料でできる Gemma3 270M のフルモデルファインチューニング

このガイドでは、Hugging Face TransformersとTRLを使用して、モバイルゲームのNPCデータセットでGemmaをファインチューニングする方法を説明します。以下の内容を学習します：開発環境のセットアップファインチューニン...

2025.08.21

AI・機械学習AI開発PythonゲームAI大規模言語モデル

Handa et al., 2025このノートブックでは、「AIによってどのような経済タスクが実行されているか？：数百万のClaude会話からの証拠」という研究の分析を再現します。この研究は、AIアシスタントであるClaudeがどのような職...

2025.03.03

AIアシスタントAI・機械学習Python開発データ分析

はじめにこのノートブックでは、LLMを使用して高品質なQAデータセットを生成するシステムを実装します。特徴は以下の通りです：コンテキストアウェアな質問生成リフレクティブな品質評価・改善自動的なデータセットのアップロード環境セットアップ!pi...

2024.11.25

Python開発データセット作成大規模言語モデル (LLM)

はじめにこのノートブックでは、LLM（大規模言語モデル）の回答品質を自動的に評価するためのシステムを実装します。このシステムは、質問、模範解答、LLMの回答を比較し、4段階のスケールで評価を行います。目的LLMの回答品質を定量的に評価する評...

2024.10.29

AIソフトウェア開発データサイエンス機械学習

はじめにAbstraction and Reasoning Corpus (ARC) チャレンジは、人工知能の抽象化と推論能力を測るための興味深いコンペティションです。このガイドでは、ARCチャレンジ2024のデータセットを可視化し、基本的...

2024.07.02

データ分析人工知能機械学習

description（説明の追加）このデータセットは、Pythonを使って数学の問題を自動生成するためのサンプルコードと生成されたデータを含んでいます。元となる10種類の数学問題のテンプレートを用意し、各問題に対してパラメータをランダムに...

2024.05.02

Pythonデータサイエンス教育

Supervised Fine-tuning Trainer (SFT) 入門Supervised Fine-tuning (SFT) は、Reinforcement Learning from Human Feedback (RLHF) ...

2024.04.18

TRL大規模言語モデル機械学習自然言語処理

OpenToM: 大規模言語モデルのTheory-of-Mind推論能力を評価する包括的ベンチマークOpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reaso...

2024.04.17

AI評価自然言語処理

Google Colabは無料で利用できるクラウドベースのJupyter Notebook環境です。Colabを使うと、ブラウザ上でPythonコードを実行し、機械学習モデルの構築やデータ分析を手軽に行えます。ここでは、Google Col...

2024.04.17

Google Colabチュートリアルデータ収集