AI音楽生成 M2UGenのざっくり論文解説 全体ざっくり解説はじめにMLLMsは、テキスト、視覚、オーディオ、3Dなどの多様なモダリティをつなぐ役割を果たしています。これらのモデルは、人間の意図を理解し、画像や音楽などの出力を生成するために使用されていますが、理解と生成を統合する研究... 2024.01.09 AI音楽生成マルチモーダル論文解説