概要
最近、GraphRAGのローカル検索機能に関するドキュメントで、いくつかの不一致が報告されました。この記事では、報告された問題と提案された解決策について詳しく説明します。
報告された問題
- 標準のインデックス作成パイプラインで
create_final_covariates.parquet
ファイルが生成されなくなった。 - ローカル検索コンテキストビルダーの共変量セクションの設定に関する混乱。
- 環境変数
GRAPHRAG_CLAIM_EXTRACTION_ENABLED
のデフォルト値に関する疑問。
問題の詳細と解決策
create_final_covariates.parquetファイルの生成
問題: 標準のインデックス作成パイプラインでcreate_final_covariates.parquet
ファイルが生成されなくなりました。
解決策: ローカル検索コンテキストビルダーの共変量セクションを[なし]
に設定する必要があります。
環境変数の設定
問題: ドキュメントによると、GRAPHRAG_CLAIM_EXTRACTION_ENABLED
がデフォルトでFalse
に設定されています。これがcreate_final_covariates.parquet
ファイルが生成されない理由と考えられます。
疑問: なぜこの設定がデフォルトでFalse
になっているのか?LLM呼び出しの過剰を避けるためか、他の理由があるのか?
CLIコマンドとコードの不一致
発見: CLIコマンドでローカル検索を実行すると、問題なく動作しました。
解決策: https://github.com/microsoft/graphrag/blob/main/graphrag/query/cli.py
のコードを確認したところ、Covariateを空の文字列に設定することで無視できることが分かりました。
結論
-
ドキュメントの更新が必要です。特に、
create_final_covariates.parquet
ファイルの生成に関する記述を修正する必要があります。 -
環境変数
GRAPHRAG_CLAIM_EXTRACTION_ENABLED
のデフォルト値とその理由について、開発チームからの説明が求められています。 -
CLIコマンドとコードの動作の違いについて、さらなる調査と説明が必要かもしれません。
-
ユーザーは、Covariateを空の文字列に設定することで、必要に応じてこの機能を無視できることを知っておくべきです。
これらの問題点と解決策を踏まえて、ドキュメントを更新し、ユーザーにより明確なガイダンスを提供することが推奨されます。
コメント