Neo4j
Neo4j是一個本機圖形數據庫,利用數據作為一流的實體的關係。你可以連接一個磚集群Neo4j集群使用neo4j-spark-connector提供Apache火花api為抽樣,DataFrame, GraphFrames。neo4j-spark-connector使用二進製螺栓協議傳輸數據和從Neo4j服務器。
本文描述如何部署和配置Neo4j,配置訪問Neo4j磚,並包括一個筆記本演示使用。
Neo4j部署和配置
您可以部署Neo4j各種雲提供商。
在AWS EC2 AMI使用自定義部署Neo4j遵循的指令托管Neo4j EC2 AWS。其他選項,請參閱官方Neo4j雲部署指南。本指南假定Neo4j 3.2.2。
改變從默認的Neo4j密碼(您應該促使當你第一次訪問Neo4j)和修改conf / neo4j.conf
接受遠程連接。
# conf / neo4j.conf#螺栓接頭dbms.connector.bolt.enabled=真正的# dbms.connector.bolt.tls_level =可選dbms.connector.bolt.listen_address=0.0.0.0:7687# HTTP連接器。必須有一個HTTP連接器。dbms.connector.http.enabled=真正的# dbms.connector.http.listen_address = 0.0.0.0:7474# HTTPS連接器。可以有0或1 HTTPS連接器。dbms.connector.https.enabled=真正的# dbms.connector.https.listen_address = 0.0.0.0:7473
有關更多信息,請參見配置Neo4j連接器。
磚的配置
如果你Neo4j集群運行在AWS和您想要使用私有ip,看到VPC凝視指南。
安裝兩個庫:neo4j-spark-connector和graphframes作為火花包。看到庫指南說明。
創建一個集群火花配置。
spark.neo4j.bolt。url螺栓:/ / < ip-of-neo4j-instance >: 7687 spark.neo4j.bolt。用戶<用戶名> spark.neo4j.bolt。密碼<密碼>
導入庫和測試連接。
進口org。neo4j。火花。_進口org。graphframes。_瓦爾neo=Neo4j(sc)/ /虛擬數字查詢檢查連接瓦爾testConnection=neo。數字(“匹配(n)返回n”;)。loadRdd(長]