美文网首页
一种给傻子看的批量将三元组存储到Neo4j的方式

一种给傻子看的批量将三元组存储到Neo4j的方式

作者: 粉色的蛋 | 来源:发表于2020-03-03 19:39 被阅读0次

    准备工作

    image.png

    首先你要有几张节点( Node )表 存储了你要创建的节点 ,比如说我这里的节点一种有4种类型,分别是‘person’,‘event’,‘organization’,‘paintings’ 随便打开一个是这样的


    image.png
    image.png

    表头name 记录了每个节点的标签名,可以理解为每个节点的名字
    同时我还有一张关联表,里面存储了节点与节点之间的关联( Relation )


    image.png
    name_x是节点1 的标签名_type 是关联,name_y是节点二的标签名,用第一列数据举例子 ,这个三元组在neo4j中是这样的
    image.png
    那么如何将所有的三元组从csv导入数据库呢?
    这里介绍一种简单好理解适合新手的方式:

    首先你要学会两条Cypher语句,Cypher类似于sql语句,相似但不同,不过你也不用担心,导入数据的话你只需要掌握一些基本概念并学会这两条Cypher就够了

    Neo4j 基本概念

    Neo4j中不存在表的概念,只有两类:节点( Node )和关联( Relation ),可以简单理解为图里面的点和边。

    在数据查询中,节点一般用小括号(),关联用中括号[]。

    当然也隐含路径的概念,是用节点和关联表示的,如:(a)-[r]->(b),表示一条从节点a经关联r到节点b的路径。

    关键Cypher语句1:创建节点

    CREATE
    CREATE (节点名:标签 {属性key1:属性value1,属性key2:属性value2,……})
    #例子
    CREATE
    (李可染:person{name:'李可染'}),
    (齐白石:person{name:'齐白石'})
    

    例子

    屏幕快照 2020-03-03 下午7.19.42.png

    关键Cypher语句1:创建关联

    CREATE (节点1), (节点2), (节点3), (节点4),
    
    (节点1)-[关系1]->(节点2),
    
    (节点2)-[关系2]->(节点3),
    ### 例子
    CREATE
    (李可染:person{name:'李可染'}),
    (齐白石:person{name:'齐白石'}),
    (李小可:person{name:'李小可'}),
    (李可染)-[:师傅]->(齐白石),
    (李可染)-[:儿子]->(李小可),
    (李可染)-[:弟子]->(李小可)
    
    

    例子

    屏幕快照 2020-03-03 下午7.13.13.png

    自动化生成语句

    也就是说想要一次将这些三元组都导入进去我们只需要写几十行的Cypher语句就可以了,我们借用这个思路,但咱不手写,咱用python的循环语句帮咱写

    import pandas as pd
    
    #读取数据
    person=pd.read_csv("person.csv",encoding='UTF-8')
    event=pd.read_csv("event.csv",encoding='UTF-8')
    organization=pd.read_csv("organization.csv",encoding='UTF-8')
    paintings=pd.read_csv("paintings.csv",encoding='UTF-8')
    re3=pd.read_csv("db.csv",encoding='UTF-8')
    
    print('create')
    for i in person['name']:
        print("("+i+":person{name:'"+ i+"'}),")
                
    #创建event节点语句
    for i in event['name']:
        print("("+i+":event{name:'"+ i+"'}),")
               
    #创建organization节点语句
    for i in organization['name']:
        print("("+i+":organization{name:'"+ i+"'}),")
        
    #创建paintings节点语句
    for i in paintings['name']:
        print("("+i+":paintings{name:'"+ i+"'}),")
    b=0
    for i in range(len(re3)):
        b=b+1
        if b<len(re3):
            print('('+re3['name_x'][i]+')-[:'+re3['_type'][i]+']->('+re3['name_y'][i]+'),')
        else:
             
            print('('+re3['name_x'][i]+')-[:'+re3['_type'][i]+']->('+re3['name_y'][i]+')')
    

    运行上面的程序你会得到程序自动化生产的的Cypher语句

    create
    (李可染:person{name:'李可染'}),
    (齐白石:person{name:'齐白石'}),
    (李小可:person{name:'李小可'}),
    (范曾:person{name:'范曾'}),
    (马波生:person{name:'马波生'}),
    (李玉琴:person{name:'李玉琴'}),
    (徐悲鸿:person{name:'徐悲鸿'}),
    (江山如此多娇:event{name:'江山如此多娇'}),
    (全国美术作品展览:event{name:'全国美术作品展览'}),
    (北京保利:event{name:'北京保利'}),
    (李可染中国画展:event{name:'李可染中国画展'}),
    (中国美术家协会:organization{name:'中国美术家协会'}),
    (中央美术学院:organization{name:'中央美术学院'}),
    (中国画研究院:organization{name:'中国画研究院'}),
    (清漓胜境图:paintings{name:'清漓胜境图'}),
    (万山红遍:paintings{name:'万山红遍'}),
    (犟牛图轴:paintings{name:'犟牛图轴'}),
    (拨阮图:paintings{name:'拨阮图'}),
    (江山无尽图:paintings{name:'江山无尽图'}),
    (李可染)-[:师傅]->(齐白石),
    (李可染)-[:儿子]->(李小可),
    (李可染)-[:弟子]->(李小可),
    (范曾)-[:同门]->(李小可),
    (李玉琴)-[:同父异母姐弟]->(李小可),
    (李可染)-[:弟子]->(范曾),
    (李可染)-[:弟子]->(马波生),
    (李可染)-[:长女]->(李玉琴),
    (李可染)-[:作品]->(清漓胜境图),
    (李可染)-[:作品]->(万山红遍),
    (李可染)-[:画展]->(江山如此多娇),
    (李可染)-[:任职]->(中国美术家协会),
    (李可染)-[:作品]->(犟牛图轴),
    (李可染)-[:作品]->(拨阮图),
    (李可染)-[:作品]->(江山无尽图),
    (江山无尽图)-[:获奖]->(全国美术作品展览),
    (李可染)-[:任职]->(中央美术学院),
    (李可染)-[:任职]->(中国画研究院),
    (万山红遍)-[:拍卖]->(北京保利),
    (拨阮图)-[:收藏]->(徐悲鸿),
    (李可染)-[:画展]->(李可染中国画展)
    

    复制粘贴吧

    把这些Cypher语句复制进Neo4j编辑器吧,你会的得到你想要的

    屏幕快照 2020-03-03 下午7.36.08.png

    相关文章

      网友评论

          本文标题:一种给傻子看的批量将三元组存储到Neo4j的方式

          本文链接:https://www.haomeiwen.com/subject/yndklhtx.html