開発ツール

LLM

OllamaのK/V Context量子化の実践的検証と実装

はじめにOllamaにおけるK/V context cache量子化は、VRAM使用量を大幅に削減できる革新的な技術です。本記事では、実際の検証結果を基に、その効果と実用性について詳しく解説します。また、検証に使用したスクリプトのセットアッ...
ソフトウェア開発

Voidへの貢献

以下はvoidのCONTRIBUTING.mdの日本語訳ですはじめにようこそ!👋 これはVoidへの貢献方法についてのガイドです。できるだけ簡単に貢献できるようにしたいと考えていますので、質問やコメントがある場合は、メールやDiscordで...