美文网首页我爱编程
豆瓣电影top250爬虫系列(二)--- python数据库连接

豆瓣电影top250爬虫系列(二)--- python数据库连接

作者: mler801 | 来源:发表于2018-05-27 22:55 被阅读0次

    github源码下载

    • 这里我将爬取到的电影信息存到mysql数据库里面。

    • 数据库配置信息

    import pymysql
    
    conn = pymysql.connect(
        host = 'localhost', #服务器ip地址
        port = 3306, #端口号
        db = 'movie',#数据库名字
        user = 'root', #数据库用户名
        passwd = '123456',#数据库密码
        charset = 'utf8mb4' #mysql中utf8不能存储4个字节的字符,此处与数据库中字符串编码类型都必须为utf8mb4
    )
    
    cursor = conn.cursor()
    cursor.execute('sql语句')
    

    tips:

    • 数据库设计遵循三范式原则,每个表尽可能少的关联其他相关表的字段信息,所以获奖表、短评表、演员表都只保留了电影表相关电影的id;
    • 电影表与演员表、评论表、获奖表都是一对多的关系;
    • 其他电影相关信息与电影本身是一对一的关系,所以都写在了电影表中;

    下面对数据库各表介绍:

    • 演员表


      actor.jpg
    • 获奖信息表


      award.jpg
    • 短评论表


      comment.jpg
    • 主表--电影表


      movie.jpg

    相关文章

      网友评论

        本文标题:豆瓣电影top250爬虫系列(二)--- python数据库连接

        本文链接:https://www.haomeiwen.com/subject/hhwijftx.html