ローカルNeo4jを使用したGraphRAGアプリケーション

このノートブックでは、ローカルのNeo4jインスタンスを使用してRAG（Retrieval-Augmented Generation）アプリケーションを実装する方法を詳細に説明します。

Neo4j-docker-starterリポジトリの詳細解～Pythonで始めるグラフデータベース入門～

はじめにこんにちは！今回は、Neo4j-docker-starterリポジトリのexampleディレクトリに含まれるPythonスクリプトを詳しく解説していきます。このチュートリアルは、Neo4jグラフデータベースとPythonを使ったアプ...

Neo4j環境のセットアップ
データセットのインポート
Neo4jベクトルインデックスの作成
ベクトル類似性検索の実行
RetrievalQAモジュールの作成
Cypherクエリの生成と実行
知識グラフエージェントの作成
リポジトリ
注意点
参考サイト
- 関連

Neo4j環境のセットアップ

まず、必要なライブラリをインポートし、ローカルのNeo4jデータベースへの接続を設定します。

from langchain.graphs import Neo4jGraph

# ローカルのNeo4jデータベースの接続情報を設定
URI = "bolt://localhost:7687"  
AUTH = ("neo4j", "your_password") 

# Neo4jGraphオブジェクトを作成し、ローカルデータベースに接続
graph = Neo4jGraph(
    url=URI, 
    username=AUTH[0], 
    password=AUTH[1]
)

このコードブロックでは、ローカルで動作しているNeo4jデータベースへの接続を設定しています。URIは「neo4j://localhost:7687」に、AUTHはユーザー名とパスワードのタプルに設定されています。

データセットのインポート

次に、サンプルデータをGitHubのGistから取得し、ローカルのNeo4jデータベースにインポートします。

import requests

# GitHubのGistからサンプルデータのJSONを取得
url = "https://gist.githubusercontent.com/tomasonjo/08dc8ba0e19d592c4c3cde40dd6abcc3/raw/da8882249af3e819a80debf3160ebbb3513ee962/microservices.json"
import_query = requests.get(url).json()['query']

# 取得したクエリを実行してデータをローカルのNeo4jにインポート
graph.query(
    import_query
)

Neo4jベクトルインデックスの作成

ここでは、OpenAIの埋め込みモデルを使用して、Neo4jのベクトルインデックスを作成します。

%load_ext dotenv
%dotenv ../.env

from dotenv import load_dotenv
from langchain.vectorstores.neo4j_vector import Neo4jVector
from langchain.embeddings.openai import OpenAIEmbeddings

# OpenAIのAPIキーを環境変数に設定
# os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")

# Neo4jVectorオブジェクトを作成し、ローカルの既存のグラフからベクトルインデックスを生成
vector_index = Neo4jVector.from_existing_graph(
    OpenAIEmbeddings(),
    url=URI,
    username=AUTH[0],
    password=AUTH[1],
    index_name='tasks',
    node_label="Task",
    text_node_properties=['name', 'description', 'status'],
    embedding_node_property='embedding',
)

ベクトル類似性検索の実行

作成したベクトルインデックスを使用して類似性検索を実行します。

# ベクトル類似性検索を実行
response = vector_index.similarity_search(
    "How will RecommendationService be updated?"
)
print(response[0].page_content)

RetrievalQAモジュールの作成

LangChainのRetrievalQAモジュールを使用して、ベクトル検索結果を基にした質問応答システムを構築します。

from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

# RetrievalQAオブジェクトを作成
vector_qa = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(),
    chain_type="stuff",
    retriever=vector_index.as_retriever()
)

# 質問を実行
vector_qa.run(
    "How will recommendation service be updated?"
)

Cypherクエリの生成と実行

LangChainのGraphCypherQAChainを使用して、自然言語の質問からCypherクエリを生成し、実行します。

from langchain.chains import GraphCypherQAChain

# ローカルのグラフスキーマを更新
graph.refresh_schema()

# GraphCypherQAChainオブジェクトを作成
cypher_chain = GraphCypherQAChain.from_llm(
    cypher_llm = ChatOpenAI(temperature=0, model_name='gpt-4'),
    qa_llm = ChatOpenAI(temperature=0), 
    graph=graph, 
    verbose=True,
)

# Cypherクエリを生成して実行
cypher_chain.run(
    "How many open tickets there are?"
)

知識グラフエージェントの作成

最後に、LangChainのエージェントフレームワークを使用して、ベクトル検索とグラフ検索の両方を組み合わせた知識グラフエージェントを作成します。

from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType

# ツールのリストを定義
tools = [
    Tool(
        name="Tasks",
        func=vector_qa.run,
        description="""Useful when you need to answer questions about descriptions of tasks.
        Not useful for counting the number of tasks.
        Use full question as input.
        """,
    ),
    Tool(
        name="Graph",
        func=cypher_chain.run,
        description="""Useful when you need to answer questions about microservices,
        their dependencies or assigned people. Also useful for any sort of 
        aggregation like counting the number of tasks, etc.
        Use full question as input.
        """,
    ),
]

# エージェントを初期化
mrkl = initialize_agent(
    tools, 
    ChatOpenAI(temperature=0, model_name='gpt-4'),
    agent=AgentType.OPENAI_FUNCTIONS, 
    verbose=True
)

# エージェントに質問を実行
response = mrkl.run("Which team is assigned to maintain PaymentService?")
print(response)

リポジトリ

GitHub - Sunwood-ai-labs/Neo4j-docker-starter: Your Neo4j, in a Box.

Your Neo4j, in a Box. Contribute to Sunwood-ai-labs/Neo4j-docker-starter development by creating an account on GitHub.

注意点

ローカルのNeo4jインスタンスが正しく設定され、実行されていることを確認してください。
AUTHタプルの2番目の要素（"your_password"）を、実際のNeo4jパスワードに置き換えてください。
OpenAIのAPIキーを正しく設定していることを確認してください。環境変数OPENAI_API_KEYに有効なAPIキーを設定する必要があります。
このコードはローカル環境で動作するように設定されていますが、セキュリティに注意してください。本番環境では、パスワードやAPIキーを直接コードに記述せず、環境変数や安全な設定管理システムを使用することをお勧めします。

以上が、ローカルNeo4jを使用したRAGアプリケーションの実装方法です。このノートブックを実行することで、ローカル環境でGraphRAGシステムを構築し、テストすることができます。