美文网首页
一种给傻子看的批量将三元组存储到Neo4j的方式

一种给傻子看的批量将三元组存储到Neo4j的方式

作者: 粉色的蛋 | 来源:发表于2020-03-03 19:39 被阅读0次

准备工作

image.png

首先你要有几张节点( Node )表 存储了你要创建的节点 ,比如说我这里的节点一种有4种类型,分别是‘person’,‘event’,‘organization’,‘paintings’ 随便打开一个是这样的


image.png
image.png

表头name 记录了每个节点的标签名,可以理解为每个节点的名字
同时我还有一张关联表,里面存储了节点与节点之间的关联( Relation )


image.png
name_x是节点1 的标签名_type 是关联,name_y是节点二的标签名,用第一列数据举例子 ,这个三元组在neo4j中是这样的
image.png
那么如何将所有的三元组从csv导入数据库呢?
这里介绍一种简单好理解适合新手的方式:

首先你要学会两条Cypher语句,Cypher类似于sql语句,相似但不同,不过你也不用担心,导入数据的话你只需要掌握一些基本概念并学会这两条Cypher就够了

Neo4j 基本概念

Neo4j中不存在表的概念,只有两类:节点( Node )和关联( Relation ),可以简单理解为图里面的点和边。

在数据查询中,节点一般用小括号(),关联用中括号[]。

当然也隐含路径的概念,是用节点和关联表示的,如:(a)-[r]->(b),表示一条从节点a经关联r到节点b的路径。

关键Cypher语句1:创建节点

CREATE
CREATE (节点名:标签 {属性key1:属性value1,属性key2:属性value2,……})
#例子
CREATE
(李可染:person{name:'李可染'}),
(齐白石:person{name:'齐白石'})

例子

屏幕快照 2020-03-03 下午7.19.42.png

关键Cypher语句1:创建关联

CREATE (节点1), (节点2), (节点3), (节点4),

(节点1)-[关系1]->(节点2),

(节点2)-[关系2]->(节点3),
### 例子
CREATE
(李可染:person{name:'李可染'}),
(齐白石:person{name:'齐白石'}),
(李小可:person{name:'李小可'}),
(李可染)-[:师傅]->(齐白石),
(李可染)-[:儿子]->(李小可),
(李可染)-[:弟子]->(李小可)

例子

屏幕快照 2020-03-03 下午7.13.13.png

自动化生成语句

也就是说想要一次将这些三元组都导入进去我们只需要写几十行的Cypher语句就可以了,我们借用这个思路,但咱不手写,咱用python的循环语句帮咱写

import pandas as pd

#读取数据
person=pd.read_csv("person.csv",encoding='UTF-8')
event=pd.read_csv("event.csv",encoding='UTF-8')
organization=pd.read_csv("organization.csv",encoding='UTF-8')
paintings=pd.read_csv("paintings.csv",encoding='UTF-8')
re3=pd.read_csv("db.csv",encoding='UTF-8')

print('create')
for i in person['name']:
    print("("+i+":person{name:'"+ i+"'}),")
            
#创建event节点语句
for i in event['name']:
    print("("+i+":event{name:'"+ i+"'}),")
           
#创建organization节点语句
for i in organization['name']:
    print("("+i+":organization{name:'"+ i+"'}),")
    
#创建paintings节点语句
for i in paintings['name']:
    print("("+i+":paintings{name:'"+ i+"'}),")
b=0
for i in range(len(re3)):
    b=b+1
    if b<len(re3):
        print('('+re3['name_x'][i]+')-[:'+re3['_type'][i]+']->('+re3['name_y'][i]+'),')
    else:
         
        print('('+re3['name_x'][i]+')-[:'+re3['_type'][i]+']->('+re3['name_y'][i]+')')

运行上面的程序你会得到程序自动化生产的的Cypher语句

create
(李可染:person{name:'李可染'}),
(齐白石:person{name:'齐白石'}),
(李小可:person{name:'李小可'}),
(范曾:person{name:'范曾'}),
(马波生:person{name:'马波生'}),
(李玉琴:person{name:'李玉琴'}),
(徐悲鸿:person{name:'徐悲鸿'}),
(江山如此多娇:event{name:'江山如此多娇'}),
(全国美术作品展览:event{name:'全国美术作品展览'}),
(北京保利:event{name:'北京保利'}),
(李可染中国画展:event{name:'李可染中国画展'}),
(中国美术家协会:organization{name:'中国美术家协会'}),
(中央美术学院:organization{name:'中央美术学院'}),
(中国画研究院:organization{name:'中国画研究院'}),
(清漓胜境图:paintings{name:'清漓胜境图'}),
(万山红遍:paintings{name:'万山红遍'}),
(犟牛图轴:paintings{name:'犟牛图轴'}),
(拨阮图:paintings{name:'拨阮图'}),
(江山无尽图:paintings{name:'江山无尽图'}),
(李可染)-[:师傅]->(齐白石),
(李可染)-[:儿子]->(李小可),
(李可染)-[:弟子]->(李小可),
(范曾)-[:同门]->(李小可),
(李玉琴)-[:同父异母姐弟]->(李小可),
(李可染)-[:弟子]->(范曾),
(李可染)-[:弟子]->(马波生),
(李可染)-[:长女]->(李玉琴),
(李可染)-[:作品]->(清漓胜境图),
(李可染)-[:作品]->(万山红遍),
(李可染)-[:画展]->(江山如此多娇),
(李可染)-[:任职]->(中国美术家协会),
(李可染)-[:作品]->(犟牛图轴),
(李可染)-[:作品]->(拨阮图),
(李可染)-[:作品]->(江山无尽图),
(江山无尽图)-[:获奖]->(全国美术作品展览),
(李可染)-[:任职]->(中央美术学院),
(李可染)-[:任职]->(中国画研究院),
(万山红遍)-[:拍卖]->(北京保利),
(拨阮图)-[:收藏]->(徐悲鸿),
(李可染)-[:画展]->(李可染中国画展)

复制粘贴吧

把这些Cypher语句复制进Neo4j编辑器吧,你会的得到你想要的

屏幕快照 2020-03-03 下午7.36.08.png

相关文章

网友评论

      本文标题:一种给傻子看的批量将三元组存储到Neo4j的方式

      本文链接:https://www.haomeiwen.com/subject/yndklhtx.html