ソフトウェア開発 LLM評価システム (LLMs as a Judge):📒Goolgeノートブック付 はじめにこのノートブックでは、LLM(大規模言語モデル)の回答品質を自動的に評価するためのシステムを実装します。このシステムは、質問、模範解答、LLMの回答を比較し、4段階のスケールで評価を行います。目的LLMの回答品質を定量的に評価する評... 2024.10.29 ソフトウェア開発機械学習データサイエンスAI
LLM LiteLLMを活用してOllamaをGoogle Colabで効率的に運用する方法 (📒ノートブック付) はじめにローカルLLMの運用において、OllamaとLiteLLMの組み合わせは非常に強力なソリューションとなっています。本記事では、Google Colab環境でこれらのツールを効率的に統合する方法を解説します。OllamaとはOllam... 2024.10.28 LLMAIツールPython開発ローカル開発Google Colab
AIアプリケーション開発 Anthropic Claude の Computer Use Demo を解剖する:仮想世界を操るAIエージェント この記事では、Anthropic社の提供するcomputer-use-demo-jpリポジトリを徹底的に解剖し、その構造、機能、そしてコードの詳細まで踏み込んで解説します。Claude 3.5 Sonnetの"computer use"機能... 2024.10.24 AIアプリケーション開発AIエージェント開発
AI・機械学習 LLMの効率化: Llama 3.1 8BからLlama-3.1-Minitron 4Bへのプルーニングと蒸留 はじめに:LLMの課題と小型化の重要性大規模言語モデル(LLM)は自然言語処理の分野で革命を起こしていますが、その巨大なサイズゆえに課題も抱えています。Llama 3.1 405BやNVIDIA Nemotron-4 340Bのような大規模... 2024.08.18 AI・機械学習
インフラストラクチャ AWS構成図を自動生成!Terraform × AI で実現するプロンプトジェネレータ AWS構成図を自動生成!Terraform × AI で実現するプロンプトジェネレータはじめにAWSインフラの構築とその可視化に悩んでいませんか?EC2 AWS Visual Sandboxを使えば、Terraformで作成したAWSリソー... 2024.08.10 インフラストラクチャAIツールAWS
AI・機械学習 Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開 このノートブックでは、Googleが新たにリリースした軽量ながらも高性能な言語モデル Gemma 2 2B を、日本語データセット databricks-dolly-15k-ja でファインチューニングする方法を紹介します。さらに、Kagg... 2024.08.05 AI・機械学習自然言語処理チュートリアル
機械学習 Gemma2-2b: TPUを活用したファインチューニングとKagglehubへのアップロード はじめにこんにちは!今回は、Googleが新しくリリースしたGemma2-2b モデルを使って、TPU(Tensor Processing Unit)を活用したファインチューニングを行い、その結果をKagglehubにアップロードする方法を... 2024.08.02 機械学習自然言語処理チュートリアル
AI開発 OpenAIクレジット2500ドルの最適な活用法:アイデアと可能性を探る はじめにOpenAIのAPI利用クレジット2500ドルを手に入れたとき、どのように活用すれば最大の効果が得られるでしょうか?本記事では、Reddit上で議論された様々なアイデアを紹介しながら、OpenAIのクレジットを効果的に使用する方法に... 2024.07.28 AI開発OpenAI
AI開発 Big Tiger Gemma 27B v1:Gemmaの無修正バージョン はじめに人工知能の世界で、新たな星が誕生しました。その名も「Big Tiger Gemma 27B v1」。この記事では、このモデルの特徴や使い方、そして私たちの生活にもたらす可能性について、詳しく解説していきます。Big Tiger Ge... 2024.07.21 AI開発AI・機械学習
AI・機械学習 SpreadsheetLLM: 大規模言語モデルによる革新的なスプレッドシート処理 はじめにスプレッドシートは、ビジネスや個人の日常生活で広く使用されているデータ管理ツールです。しかし、その複雑な構造や大量のデータを効率的に処理することは、従来の手法では困難でした。本記事では、大規模言語モデル(LLM)を活用して、スプレッ... 2024.07.17 AI・機械学習ソフトウェア開発データ分析