モデル学習

AI・機械学習

Hugging Face AccelerateによるFSDPとDeepSpeedの比較と使い分け方

はじめに近年、大規模言語モデルの学習には多くのGPUリソースが必要とされています。そこで登場したのが、Zero Redundancy Optimizer (Zero)アルゴリズムを実装したDeepSpeedとPyTorch FSDPの2つの...
AI・機械学習

進化的モデルマージでAIモデルをパワーアップ!mergekit-evolve(GoogleColab版)

進化的なモデルマージとは、複数の言語モデルを組み合わせて、特定の能力や特性を持つ新しいモデルを作成する手法です。従来の手法では、どのモデルをどのように組み合わせるかは手探りで進める必要がありましたが、進化的なモデルマージでは、目標とする特性...
AI・機械学習

JAXとWandbとSelf-Consistencyを使ったGemma Instruct 2Bモデルのファインチューニング入門

このノートブックでは、Kaggleの"AI Mathematical Olympiad"コンペティションに向けて、JAXをバックエンドに使用してGemma Instruct 2Bモデルをファインチューニングする方法を解説します。また、Wei...