MLLM

AI・機械学習

【RTX3060】Multimodal Large Language Models(MLLM)のSPHINX-TinyをDockerで動かしてみる

AI技術の進化は日々加速しており、その中でもMultimodal Large Language Models(MLLM)の一角を担うSPHINXは特に注目に値します。この記事では、Windows11とRTX3060を使用し、Docker環境...
AI音楽生成

M2UGenのざっくり論文解説

全体ざっくり解説はじめにMLLMsは、テキスト、視覚、オーディオ、3Dなどの多様なモダリティをつなぐ役割を果たしています。これらのモデルは、人間の意図を理解し、画像や音楽などの出力を生成するために使用されていますが、理解と生成を統合する研究...