AI・機械学習

AI・機械学習

Gorilla OpenFunctions: 大規模言語モデルとAPIを繋ぐ画期的なオープンソース・プロジェクト

Gorilla OpenFunctionsとはGorilla OpenFunctionsは、大規模言語モデル(Large Language Model, LLM)のチャット補完機能を拡張し、自然言語の指示とAPIの文脈から実行可能なAPI呼...
チュートリアル

LangchainとGeminiを使ってみた(GoogleColab付)

Langchainは、言語モデルを活用したアプリケーション開発のためのフレームワークです。この記事では、Langchainを使ってGoogleのGenerative AIモデルを効果的に使用する方法を、初心者にも分かりやすく解説します。La...
AI・機械学習

BitNetのリポジトリ日本語化

BitNetは、大規模言語モデルのための1ビットトランスフォーマーを拡張する新しい取り組みです。この記事では、BitNetの基本から最新の進展まで、初心者でも理解しやすいように解説します。論文「BitNet: Scaling 1-bit T...
AI・機械学習

Local RAGをWindowsのOllama for Windows (Preview)で動かしてみた

最近、Windowsで動作するOllama for Windows (Preview)を使って、Local RAG(Retrieval Augmented Generation)を体験してみました。この記事では、そのプロセスと私の体験をステ...
AI・機械学習

Gemini 1.5登場: Googleの革新的AIが拓く100万トークンの未来

2024年2月15日この文書では、大幅に向上したパフォーマンスと、モダリティを超えた長文理解における革新的な進歩を提供する新しい世代のモデル「Gemini 1.5」について紹介します。サンダー・ピチャイとデミス・ハサビスからのメッセージサン...
AI・機械学習

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...
AI・機械学習

YOLO-WorldをGoogle Colabで動かしてみた

近年の技術進歩により、画像認識技術は目覚ましい発展を遂げています。その中でも、「You Only Look Once(YOLO)」シリーズは、その高速性と実用性で広く認知されています。しかし、従来のYOLOは予め定義されたカテゴリーに基づい...
AI・機械学習

【RTX3060】Multimodal Large Language Models(MLLM)のSPHINX-TinyをDockerで動かしてみる

AI技術の進化は日々加速しており、その中でもMultimodal Large Language Models(MLLM)の一角を担うSPHINXは特に注目に値します。この記事では、Windows11とRTX3060を使用し、Docker環境...
AI・機械学習

Google Colab上でQLoRAを作成してGGUFに変換してみた

はじめにこのコードは、Google Colab(無料版でOK)上でQLoRA (Quantized Low-Rank Adaptation)を使用して大規模言語モデルを訓練し、その後GGUF形式に変換するためのものです。それぞれの部分につい...
AI・機械学習

無料枠Google Colab で LLaMA-Factory をやってみた

はじめにGoogle Colabは、ブラウザ上でPythonを実行できる無料のサービスです。これを使って、LLaMA-Factoryを動かしてみましょう。LLaMA-Factoryは、大規模言語モデル(LLM)のファインチューニングを容易に...