PyTorch

LLMs-from-scratch 日本語ノートブック【第2章: テキストデータの処理 – 実行結果と解説】（📒Google colab付き）

Build a Large Language Model From Scratch 書籍（著者: Sebastian Raschka）の補足コードコードリポジトリ: この記事では、Sebastian Raschkaの「Build a Lar...

2025.03.28

AI・機械学習プログラミングAI開発

📦 必要なライブラリのインストール%%capture!pip install unsloth# 最新のUnslothナイトリービルドを取得!pip uninstall unsloth -y && pip install --upgrade ...

2024.11.27

LLMPython開発ファインチューニング

はじめにこの記事では、Meta社が開発した最新の大規模言語モデル「LLaMA 3.1」を使って、AIチャットボットを作成する方法を解説します。LLaMA 3.1は多言語対応の強力なモデルで、様々なタスクに適用できます。今回は、海賊風に話すチ...

2024.07.28

AIチャットボット開発大規模言語モデル

はじめにこんにちは！この記事では、PyTorchとCUDAを使用するための環境設定について、初心者の方にも分かりやすく解説していきます。最近、エラーに悩まされていた方が、Docker for Windowsの更新とWSL integrati...

2024.07.11

エラー解決Python開発環境

RecurrentGemmaは、Google DeepMindによる、新しいGriffinアーキテクチャに基づいたオープンウェイトの言語モデルファミリーです。このアーキテクチャは、グローバルアテンションをローカルアテンションと線形再帰の混合...

2024.06.16

AI・機械学習自然言語処理日本語AI

BitNetは、大規模言語モデルのための1ビットトランスフォーマーを拡張する新しい取り組みです。この記事では、BitNetの基本から最新の進展まで、初心者でも理解しやすいように解説します。論文「BitNet: Scaling 1-bit T...

2024.03.03

AI・機械学習自然言語処理大規模言語モデル