Neo4j

Neo4j是一個本機圖形數據庫,利用數據作為一流的實體的關係。你可以連接一個磚集群Neo4j集群使用neo4j-spark-connector提供Apache火花api為抽樣,DataFrame, GraphFrames。neo4j-spark-connector使用二進製螺栓協議傳輸數據和從Neo4j服務器。

本文描述如何部署和配置Neo4j,配置訪問Neo4j磚,並包括一個筆記本演示使用。

Neo4j部署和配置

您可以部署Neo4j各種雲提供商。

在AWS EC2 AMI使用自定義部署Neo4j遵循的指令托管Neo4j EC2 AWS。其他選項,請參閱官方Neo4j雲部署指南。本指南假定Neo4j 3.2.2

改變從默認的Neo4j密碼(您應該促使當你第一次訪問Neo4j)和修改conf / neo4j.conf接受遠程連接。

# conf / neo4j.conf#螺栓接頭dbms.connector.bolt.enabled=真正的# dbms.connector.bolt.tls_level =可選dbms.connector.bolt.listen_address=0.0.0.0:7687# HTTP連接器。必須有一個HTTP連接器。dbms.connector.http.enabled=真正的# dbms.connector.http.listen_address = 0.0.0.0:7474# HTTPS連接器。可以有0或1 HTTPS連接器。dbms.connector.https.enabled=真正的# dbms.connector.https.listen_address = 0.0.0.0:7473

有關更多信息,請參見配置Neo4j連接器

磚的配置

如果你Neo4j集群運行在AWS和您想要使用私有ip,看到VPC凝視指南。

  1. 安裝兩個庫:neo4j-spark-connectorgraphframes作為火花包。看到指南說明。

  2. 創建一個集群火花配置

    spark.neo4j.bolt。url螺栓:/ / < ip-of-neo4j-instance >: 7687 spark.neo4j.bolt。用戶<用戶名> spark.neo4j.bolt。密碼<密碼>
  3. 導入庫和測試連接。

    進口orgneo4j火花_進口orggraphframes_瓦爾neo=Neo4j(sc)/ /虛擬數字查詢檢查連接瓦爾testConnection=neo數字(“匹配(n)返回n”;)。loadRdd(]

Neo4j筆記本

在新標簽頁打開筆記本