大規模言語モデル

ソフトウェア開発

LLM評価システム (LLMs as a Judge):📒Goolgeノートブック付

はじめにこのノートブックでは、LLM(大規模言語モデル)の回答品質を自動的に評価するためのシステムを実装します。このシステムは、質問、模範解答、LLMの回答を比較し、4段階のスケールで評価を行います。目的LLMの回答品質を定量的に評価する評...
LLM

LiteLLMを活用してOllamaをGoogle Colabで効率的に運用する方法 (📒ノートブック付)

はじめにローカルLLMの運用において、OllamaとLiteLLMの組み合わせは非常に強力なソリューションとなっています。本記事では、Google Colab環境でこれらのツールを効率的に統合する方法を解説します。OllamaとはOllam...
AIアプリケーション開発

Anthropic Claude の Computer Use Demo を解剖する:仮想世界を操るAIエージェント

この記事では、Anthropic社の提供するcomputer-use-demo-jpリポジトリを徹底的に解剖し、その構造、機能、そしてコードの詳細まで踏み込んで解説します。Claude 3.5 Sonnetの"computer use"機能...
AI・機械学習

LLMの効率化: Llama 3.1 8BからLlama-3.1-Minitron 4Bへのプルーニングと蒸留

はじめに:LLMの課題と小型化の重要性大規模言語モデル(LLM)は自然言語処理の分野で革命を起こしていますが、その巨大なサイズゆえに課題も抱えています。Llama 3.1 405BやNVIDIA Nemotron-4 340Bのような大規模...
インフラストラクチャ

AWS構成図を自動生成!Terraform × AI で実現するプロンプトジェネレータ

AWS構成図を自動生成!Terraform × AI で実現するプロンプトジェネレータはじめにAWSインフラの構築とその可視化に悩んでいませんか?EC2 AWS Visual Sandboxを使えば、Terraformで作成したAWSリソー...
AI・機械学習

Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開

このノートブックでは、Googleが新たにリリースした軽量ながらも高性能な言語モデル Gemma 2 2B を、日本語データセット databricks-dolly-15k-ja でファインチューニングする方法を紹介します。さらに、Kagg...
機械学習

Gemma2-2b: TPUを活用したファインチューニングとKagglehubへのアップロード

はじめにこんにちは!今回は、Googleが新しくリリースしたGemma2-2b モデルを使って、TPU(Tensor Processing Unit)を活用したファインチューニングを行い、その結果をKagglehubにアップロードする方法を...
AI開発

OpenAIクレジット2500ドルの最適な活用法:アイデアと可能性を探る

はじめにOpenAIのAPI利用クレジット2500ドルを手に入れたとき、どのように活用すれば最大の効果が得られるでしょうか?本記事では、Reddit上で議論された様々なアイデアを紹介しながら、OpenAIのクレジットを効果的に使用する方法に...
AI開発

Big Tiger Gemma 27B v1:Gemmaの無修正バージョン

はじめに人工知能の世界で、新たな星が誕生しました。その名も「Big Tiger Gemma 27B v1」。この記事では、このモデルの特徴や使い方、そして私たちの生活にもたらす可能性について、詳しく解説していきます。Big Tiger Ge...
AI・機械学習

SpreadsheetLLM: 大規模言語モデルによる革新的なスプレッドシート処理

はじめにスプレッドシートは、ビジネスや個人の日常生活で広く使用されているデータ管理ツールです。しかし、その複雑な構造や大量のデータを効率的に処理することは、従来の手法では困難でした。本記事では、大規模言語モデル(LLM)を活用して、スプレッ...