PyTorch

LLM

🦙 Unslothで作成したLLaMA 3.2ベースのファインチューニングモデルを使った高速推論ガイド(GoogleColab📒ノートブック付)

📦 必要なライブラリのインストール%%capture!pip install unsloth# 最新のUnslothナイトリービルドを取得!pip uninstall unsloth -y && pip install --upgrade ...
AIチャットボット開発

LLaMA 3.1モデルを使ったAIチャットボットの作成:初心者向けガイド

はじめにこの記事では、Meta社が開発した最新の大規模言語モデル「LLaMA 3.1」を使って、AIチャットボットを作成する方法を解説します。LLaMA 3.1は多言語対応の強力なモデルで、様々なタスクに適用できます。今回は、海賊風に話すチ...
エラー解決

PyTorchとCUDAの環境設定ガイド「UserWarning: CUDA initialization」

はじめにこんにちは!この記事では、PyTorchとCUDAを使用するための環境設定について、初心者の方にも分かりやすく解説していきます。最近、エラーに悩まされていた方が、Docker for Windowsの更新とWSL integrati...
AI・機械学習

RecurrentGemma 日本語版README

RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合...
AI・機械学習

BitNetのリポジトリ日本語化

BitNetは、大規模言語モデルのための1ビットトランスフォーマーを拡張する新しい取り組みです。この記事では、BitNetの基本から最新の進展まで、初心者でも理解しやすいように解説します。論文「BitNet: Scaling 1-bit T...