美文网首页图数据库Neo4j知识图谱
Neo4j学习(三)neo4j-import 数据导入

Neo4j学习(三)neo4j-import 数据导入

作者: 司马山哥 | 来源:发表于2019-11-22 10:45 被阅读0次

    1neo4j三种数据导入工作

    • create 语句
    • load CSV 语句
    • neo4j import 批量导入
      对于大数据集的导入首选neo4j import,响应快

    2 neo4j import

    导入数据之前先清空已有的graph.db文件夹内容

    2.1 数据集(CSV)准备

    node(节点)数据集准备

    • header格式 "node_id:ID","name",":LABEL"

    personId:ID,name,:LABEL
    keanu,"Keanu Reeves",Actor
    laurence,"Laurence Fishburne",Actor
    carrieanne,"Carrie-Anne Moss",Actor
    laurence,"Laurence Harvey",Actor

    image.png
    image.png
    • ID列唯一取值(不重复)
    • LABEL属于标签,代表这类节点的类别
      edge(边格式)
    • header格式":START_ID","name",":END_ID",":TYPE"

    "4565904","homepage","0","Predicate"
    "4654000","homepage","0","Predicate"
    "2254843","homepage","0","Predicate"
    "2346995","homepage","0","Predicate"
    "3535680","homepage","0","Predicate"
    "2090446","homepage","0","Predicate"

    image.png
    2.2 数据导入
    • 节点文件applyer.csv address.csv
    • 边文件relation.csv
      进入neo4j的安装文件bin文件夹(终端进入),输入如下命令
    .\bin> neo4j-admin import --database graph.db --id-type string --nodes:applyer C:\Users\DELL\Desktop\neo4j\applyer.csv --nodes:address C:\Users\DELL\Desktop\neo4j\address.csv --relationships C:\Users\DELL\Desktop\neo4j\relation.csv --ignore-duplicate-nodes
    

    3 常见错误

    • 节点文件存在重复
    • 文件header不规范
    • 数据中存在未知变量(CSV格式对长类型整数会进行科学计数,造成错误)
    • 数据大小超过内存
    • 其他错误(见终端log尾部报错)
    #社区版Neo4j免费资源大小
    Available resources:
      Total machine memory: 15.89 GB
      Free machine memory: 6.72 GB
      Max heap memory : 3.53 GB
      Processors: 4
      Configured max memory: 11.12 GB
      High-IO: false
    

    4 查看效果

    • neo4j.bat console 打开图数据库的前端可视化界面
    • 打开本地数据库,可以看到是否成功导入数据集

    相关文章

      网友评论

        本文标题:Neo4j学习(三)neo4j-import 数据导入

        本文链接:https://www.haomeiwen.com/subject/cbsfwctx.html