モデル評価

llama.cpp × Gemma3nでlogprobs出力！詳細な確率分析（GoogleColab📒ノートブック付）

このノートブックでは、llama.cppでGemma3nを動かし、トークンの生成確率（logprobs）を詳細に分析する方法を解説します。このノートブックでできることGemma3nの修正済みGGUFを使用（Google公式版は動作しません！...

2025.07.12

AI評価開発環境AI・機械学習LLM

はじめにこんにちは！この記事では、Google Colab上でGemmaモデル（gemma-2-9b-it-Q4_K_M.gguf）を使用して、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は、大規模言語...

2024.07.01

Python開発AI・機械学習

はじめにこんにちは！今回は、Google Colab上でkarakuri-lm-8x7b-instruct-v0.1-Q4_K_M.ggufモデルを使って、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は...

2024.06.25

AI開発AI・機械学習

はじめにこんにちは！今回は、Google Colab上でkarakuri-lm-8x7b-instruct-v0.1-ggufモデルを使って、ELYZA-tasks-100データセットの評価を行う方法をご紹介します。この記事は、大規模言語モ...

2024.06.23

AI・機械学習自然言語処理

はじめに論文の背景近年、人工知能（AI）の分野で大きな注目を集めているのが「大規模言語モデル（LLM：Large Language Model）」です。これらのモデルは、人間のような自然な文章を生成したり、複雑な質問に答えたりする能力を持っ...

2024.06.23

AI・機械学習自然言語処理

はじめにこんにちは！今回は、llama.cppを使って「Umievo-itr012-Gleipnir-7B」モデルをサーバーとして起動し、ELYZA-tasks-100の推論結果をWandB（Weights and Biases）に送信する...

2024.06.21

日本語AIAI・機械学習

進化的なモデルマージとは、複数の言語モデルを組み合わせて、特定の能力や特性を持つ新しいモデルを作成する手法です。従来の手法では、どのモデルをどのように組み合わせるかは手探りで進める必要がありましたが、進化的なモデルマージでは、目標とする特性...

2024.06.05

AI・機械学習大規模言語モデル