推論速度

AI・機械学習

AutoRound: 大規模言語モデルのための高度な量子化アルゴリズム

近年の大規模言語モデル (LLM) の進化は目覚ましいものですが、その性能と引き換えに、莫大な計算資源とメモリが必要となる点が課題となっています。AutoRoundは、この課題を解決するべく開発された、LLMのための高度な量子化アルゴリズム...