language-models

LLM

SFTTrainer と TrainingArguments を使ってバッチ数を小さくしてステップを少なくした学習コードの解説

この記事では、Hugging Face の Transformers ライブラリの SFTTrainer と TrainingArguments を使って、限られたリソースでも効率的に言語モデルをファインチューニングする方法を解説します。特...
LLM

Supervised Fine-tuning Trainer (SFT) 入門

Supervised Fine-tuning Trainer (SFT) 入門Supervised Fine-tuning (SFT) は、Reinforcement Learning from Human Feedback (RLHF) ...
AGI

Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう

はじめに近年、ChatGPTに代表される大規模言語モデル(LLM: Large Language Model)を利用したサービスが大きな注目を集めています。LLMを使えば自然言語での対話を通じて、プログラミングやデータ分析などの複雑なタスク...