AI・機械学習 【RTX3060】Multimodal Large Language Models(MLLM)のSPHINX-TinyをDockerで動かしてみる AI技術の進化は日々加速しており、その中でもMultimodal Large Language Models(MLLM)の一角を担うSPHINXは特に注目に値します。この記事では、Windows11とRTX3060を使用し、Docker環境... 2024.01.23 AI・機械学習大規模言語モデルマルチモーダル
AI音楽生成 M2UGenのざっくり論文解説 全体ざっくり解説はじめにMLLMsは、テキスト、視覚、オーディオ、3Dなどの多様なモダリティをつなぐ役割を果たしています。これらのモデルは、人間の意図を理解し、画像や音楽などの出力を生成するために使用されていますが、理解と生成を統合する研究... 2024.01.09 AI音楽生成マルチモーダル論文解説