大規模言語モデル

開発環境

PCを初期化してからLLMのリモート開発環境(LLaMA-Factory)を構築するまで

PCの初期化から始まり、LLM(大規模言語モデル)の開発環境を構築する過程は、初心者にとっても分かりやすいように段階を追って説明します。このプロセスには、必要なソフトウェアのインストールからSSH環境のリモート開発構築、そしてセキュリティ対...
AI・機械学習

Gemini 1.5登場: Googleの革新的AIが拓く100万トークンの未来

2024年2月15日この文書では、大幅に向上したパフォーマンスと、モダリティを超えた長文理解における革新的な進歩を提供する新しい世代のモデル「Gemini 1.5」について紹介します。サンダー・ピチャイとデミス・ハサビスからのメッセージサン...
AIアシスタント

WindowsでNVIDIA ChatWithRTX Demoを動かしてみた

今日のデジタル時代では、AI技術が日常生活のあらゆる面で重要な役割を果たしています。NVIDIAは、Chat with RTXという革新的なデモアプリを通じて、この技術の進化に一層貢献しています。この記事では、Chat with RTXの概...
大規模言語モデル

【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

概要(abstract)我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM(大規模言語モデル)搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵...
大規模言語モデル

GPTsとGASとGemini Proで作るLLM Bot「幻(げん)」

近年、人工知能技術の進化に伴い、多くの人々が日常生活やビジネスシーンでAIを活用するようになりました。今回は、GPTs(Generative Pre-trained Transformers)、GAS(Google Apps Script)...
AI・機械学習

【RTX3060】Multimodal Large Language Models(MLLM)のSPHINX-TinyをDockerで動かしてみる

AI技術の進化は日々加速しており、その中でもMultimodal Large Language Models(MLLM)の一角を担うSPHINXは特に注目に値します。この記事では、Windows11とRTX3060を使用し、Docker環境...
大規模言語モデル

【Learn Prompting】Prompt Hacking【日本語訳】Introduction~Prompt Injection~Prompt Leaking

Introductionプロンプトハッキングとは、LLM(大規模言語モデル)の脆弱性を悪用して、入力やプロンプトを操作することにより、不正な行為を引き起こす攻撃方法です。伝統的なハッキングがソフトウェアの脆弱性を悪用するのに対し、プロンプト...
大規模言語モデル

Google Colab上でQLoRAを作成してGGUFに変換してみた

はじめにこのコードは、Google Colab(無料版でOK)上でQLoRA (Quantized Low-Rank Adaptation)を使用して大規模言語モデルを訓練し、その後GGUF形式に変換するためのものです。それぞれの部分につい...
AIアシスタント

GPTsとは

GPTsについて近年、ChatGPTのカスタムバージョンである「GPTs」が登場しました。GPTsは、日常生活や特定のタスク、職場、家庭でより有用なChatGPTのカスタマイズ版を作成し、他の人と共有する新しい方法です。例えば、ボードゲーム...
AI・機械学習

無料枠Google Colab で LLaMA-Factory をやってみた

はじめにGoogle Colabは、ブラウザ上でPythonを実行できる無料のサービスです。これを使って、LLaMA-Factoryを動かしてみましょう。LLaMA-Factoryは、大規模言語モデル(LLM)のファインチューニングを容易に...