AI・機械学習

AI・機械学習

Gemini 1.5登場: Googleの革新的AIが拓く100万トークンの未来

2024年2月15日この文書では、大幅に向上したパフォーマンスと、モダリティを超えた長文理解における革新的な進歩を提供する新しい世代のモデル「Gemini 1.5」について紹介します。サンダー・ピチャイとデミス・ハサビスからのメッセージサン...
画像認識

ローカル画像でGemini Pro APIをOpenAI APIフォーマットで試してみた【Gemini-OpenAI-Proxy】

今回は、Gemini-OpenAI-Proxy を使用して、ローカルに保存された画像を Gemini Pro API に OpenAI API フォーマットで送信し、画像認識のデモを行います。このプロセスは、初心者でも理解しやすいように、ス...
AI・機械学習

YOLO-WorldをGoogle Colabで動かしてみた

近年の技術進歩により、画像認識技術は目覚ましい発展を遂げています。その中でも、「You Only Look Once(YOLO)」シリーズは、その高速性と実用性で広く認知されています。しかし、従来のYOLOは予め定義されたカテゴリーに基づい...
AI・機械学習

【RTX3060】Multimodal Large Language Models(MLLM)のSPHINX-TinyをDockerで動かしてみる

AI技術の進化は日々加速しており、その中でもMultimodal Large Language Models(MLLM)の一角を担うSPHINXは特に注目に値します。この記事では、Windows11とRTX3060を使用し、Docker環境...
AI・機械学習

Google Colab上でQLoRAを作成してGGUFに変換してみた

はじめにこのコードは、Google Colab(無料版でOK)上でQLoRA (Quantized Low-Rank Adaptation)を使用して大規模言語モデルを訓練し、その後GGUF形式に変換するためのものです。それぞれの部分につい...
AI・機械学習

無料枠Google Colab で LLaMA-Factory をやってみた

はじめにGoogle Colabは、ブラウザ上でPythonを実行できる無料のサービスです。これを使って、LLaMA-Factoryを動かしてみましょう。LLaMA-Factoryは、大規模言語モデル(LLM)のファインチューニングを容易に...
AI・機械学習

Perspectives on the State and Future of Deep Learning – 2023~日本語解説まとめ~

はじめに著名な研究機関の専門家7名と、AI技術の最前線で活躍するChatGPTが集い、人工知能(AI)技術の「現在」と「未来」について深い議論を交わした「Perspectives on the State and Future of Dee...
AI・機械学習

Perspectives on the State and Future of Deep Learning – 2023~Q6(学問界は困難に直面しているのか?)の日本語解説~

AbstractInterlocutorQ1:最大の未解決問題最も取り組むべきだが、まだ取り組まれていない大きな問題(Biggest problem)とは何か、またはその逆は何か。Q2:ディープラーニングの理解についてなぜ私たちはディープラ...
深層学習

Perspectives on the State and Future of Deep Learning – 2023~Q5(Transformers は将来の方向性として正しいのか?)の日本語解説~

AbstractInterlocutorQ1:最大の未解決問題最も取り組むべきだが、まだ取り組まれていない大きな問題(Biggest problem)とは何か、またはその逆は何か。Q2:ディープラーニングの理解についてなぜ私たちはディープラ...
AI・機械学習

Perspectives on the State and Future of Deep Learning – 2023~Q4(ディープラーニングは学術的なベンチマーキングを超えて進化しているのか?)の日本語解説~

AbstractInterlocutorQ1:最大の未解決問題最も取り組むべきだが、まだ取り組まれていない大きな問題(Biggest problem)とは何か、またはその逆は何か。Q2:ディープラーニングの理解についてなぜ私たちはディープラ...