ローカルNeo4jとOllamaを使用したGraphRAGアプリケーション

この記事では、ローカルのNeo4jインスタンスとOllamaのローカルLLMを使用してGraphRAG（Retrieval-Augmented Generation）アプリケーションを実装する方法を詳細に説明します。

Neo4j環境のセットアップ
データセットのインポート
Neo4jベクトルインデックスの作成
ベクトル類似性検索の実行
RetrievalQAモジュールの作成
Cypherクエリの生成と実行
知識グラフエージェントの作成
リポジトリ
注意点
1. 関連

Neo4j環境のセットアップ

まず、必要なライブラリをインポートし、ローカルのNeo4jデータベースへの接続を設定します。

from langchain.graphs import Neo4jGraph

# ローカルのNeo4jデータベースの接続情報を設定
URI = "bolt://localhost:7687"  
AUTH = ("neo4j", "your_password") 

# Neo4jGraphオブジェクトを作成し、ローカルデータベースに接続
graph = Neo4jGraph(
    url=URI, 
    username=AUTH[0], 
    password=AUTH[1]
)

このコードブロックでは、ローカルで動作しているNeo4jデータベースへの接続を設定しています。URIは「neo4j://localhost:7687」に、AUTHはユーザー名とパスワードのタプルに設定されています。

データセットのインポート

次に、サンプルデータをGitHubのGistから取得し、ローカルのNeo4jデータベースにインポートします。

import requests

# GitHubのGistからサンプルデータのJSONを取得
url = "https://gist.githubusercontent.com/tomasonjo/08dc8ba0e19d592c4c3cde40dd6abcc3/raw/da8882249af3e819a80debf3160ebbb3513ee962/microservices.json"
import_query = requests.get(url).json()['query']

# 取得したクエリを実行してデータをローカルのNeo4jにインポート
graph.query(
    import_query
)

Neo4jベクトルインデックスの作成

ここでは、Ollamaの埋め込みモデルを使用して、Neo4jのベクトルインデックスを作成します。

%load_ext dotenv
%dotenv ../.env

from dotenv import load_dotenv
from langchain.vectorstores.neo4j_vector import Neo4jVector
from langchain_community.embeddings import OllamaEmbeddings

# OpenAIのAPIキーを環境変数に設定
# os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")

ollama_embeddings = OllamaEmbeddings(
    model="llama3",
    # model_kwargs={"max_token": 1536}  # これにより出力次元が1536に設定されます
)

# Neo4jVectorオブジェクトを作成し、ローカルの既存のグラフからベクトルインデックスを生成
vector_index = Neo4jVector.from_existing_graph(
    ollama_embeddings,
    url=URI,
    username=AUTH[0],
    password=AUTH[1],
    index_name='tasks',
    node_label="Task",
    text_node_properties=['name', 'description', 'status'],
    embedding_node_property='embedding',
)

このステップでは、OllamaEmbeddingsを使用してローカルで埋め込みを生成します。これにより、外部のAPIに依存せずにベクトル化を行うことができます。

ベクトル類似性検索の実行

作成したベクトルインデックスを使用して類似性検索を実行します。

# ベクトル類似性検索を実行
response = vector_index.similarity_search(
    "How will RecommendationService be updated?"
)
print(response[0].page_content)

RetrievalQAモジュールの作成

LangChainのRetrievalQAモジュールを使用して、ベクトル検索結果を基にした質問応答システムを構築します。ここでは、Ollamaのローカルモデルを使用します。

from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOllama

ollama = ChatOllama(model="llama3")

# RetrievalQAオブジェクトを作成
vector_qa = RetrievalQA.from_chain_type(
    llm=ollama,
    chain_type="stuff",
    retriever=vector_index.as_retriever()
)

# 質問を実行
vector_qa.run(
    "How will recommendation service be updated?"
)

ChatOllamaを使用することで、ローカル環境でLLMの推論を実行できます。これにより、プライバシーを保護しつつ、外部APIへの依存を減らすことができます。

Cypherクエリの生成と実行

LangChainのGraphCypherQAChainを使用して、自然言語の質問からCypherクエリを生成し、実行します。ここでもOllamaのローカルモデルを使用します。

from langchain.chains import GraphCypherQAChain

# ローカルのグラフスキーマを更新
graph.refresh_schema()

# GraphCypherQAChainオブジェクトを作成
cypher_chain = GraphCypherQAChain.from_llm(
    cypher_llm = ollama,
    qa_llm = ollama, 
    graph=graph, 
    verbose=True,
)

# Cypherクエリを生成して実行
cypher_chain.run(
    "How many open tickets there are?"
)

知識グラフエージェントの作成

最後に、LangChainのエージェントフレームワークを使用して、ベクトル検索とグラフ検索の両方を組み合わせた知識グラフエージェントを作成します。このエージェントもOllamaのローカルモデルを利用します。

from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType

# ツールのリストを定義
tools = [
    Tool(
        name="Tasks",
        func=vector_qa.run,
        description="""Useful when you need to answer questions about descriptions of tasks.
        Not useful for counting the number of tasks.
        Use full question as input.
        """,
    ),
    Tool(
        name="Graph",
        func=cypher_chain.run,
        description="""Useful when you need to answer questions about microservices,
        their dependencies or assigned people. Also useful for any sort of 
        aggregation like counting the number of tasks, etc.
        Use full question as input.
        """,
    ),
]

# エージェントを初期化
mrkl = initialize_agent(
    tools, 
    ollama,
    agent=AgentType.OPENAI_FUNCTIONS, 
    verbose=True
)

# エージェントに質問を実行
response = mrkl.run("Which team is assigned to maintain PaymentService?")
print(response)

リポジトリ

Release 🎉Neo4j-docker-starter v0.3.0 リリースノート · Sunwood-ai-labs/Neo4j-docker-starter

Neo4j-docker-starterのバージョンv0.3.0がリリースされました！今回のアップデートでは、Ollama Embeddingsのサポートと、ローカルNeo4jを使用したRAGアプリケーション構築のサンプルコードが追加されました。新機能Ollama Embeddingsのサポート追加: テキストデータを...

注意点

ローカルのNeo4jインスタンスが正しく設定され、実行されていることを確認してください。
AUTHタプルの2番目の要素（"your_password"）を、実際のNeo4jパスワードに置き換えてください。
Ollamaが正しくインストールされ、設定されていることを確認してください。必要に応じて、使用するモデルをダウンロードしておいてください。
このコードはローカル環境で動作するように設定されていますが、セキュリティに注意してください。本番環境では、パスワードを直接コードに記述せず、環境変数や安全な設定管理システムを使用することをお勧めします。

以上が、ローカルNeo4jとOllamaを使用したGraphRAGアプリケーションの実装方法です。このノートブックを実行することで、完全にローカル環境でGraphRAGシステムを構築し、テストすることができます。これにより、データのプライバシーを保護しつつ、外部サービスへの依存を最小限に抑えることができます。