美文网首页Python
Python-爬取淘宝评论

Python-爬取淘宝评论

作者: 大森森_ | 来源:发表于2020-06-07 22:47 被阅读0次

    import urllib.request
    import urllib.parse
    import json
    import re
    import jsonpath

    items_list=[]

    def main():
    #创建循环,爬取多页的评论内容#
    url='https://rate.taobao.com/feedRateList.htm?auctionNumId=559141739630&userNumId=100340983&currentPageNum=1&pageSize=20'
    headers={
    "User-Agnet":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"
    }
    request=urllib.request.Request(url=url,headers=headers)
    json_text=urllib.request.urlopen(request).read().decode()
    print(json_text)
    #将json两边的非法字符去掉#
    json_text=json_text.strip('()\n\t\r')
    print(json_text)
    exit()
    #将json格式字符串转化为python对象#
    obj=json.loads(json_text)
    print(obj)
    print(type(obj))
    #抓取评论内容:用户头像、用户名、评论内容、评论时间、手机类型#
    #首先取出comments这个列表#
    comments_list=obj['comments']
    #遍历这个列表,依次提取每一条评论#
    for comment in comments_list:
    #用户头像#
    user=jsonpath.jsonpath(comment,'..user')[0] face='http:'+user['avatar'] #用户名# name=user['nick'] #评论内容# ping_content=comment['content'] #评论时间# ping_time=comment['date'] #手机信息# info=jsonpath.jsonpath(comment,'..sku')[0]
    #将评论信息保存到字典中#
    item={
    '用户头像':face,
    '用户名':name,
    '评论':ping_content,
    '时间':ping_time,
    '信息':info,
    }
    print(item)
    exit()

        items_list.append(item)
    

    if name=='main':
    main()

    string=json.dumps(items_list,ensure_ascii=False)
    #保存到文件中#
    with open('/Users/marine/Desktop/python/ping.txt','w',encoding='utf8') as fp:
        fp.write(string)

    相关文章

      网友评论

        本文标题:Python-爬取淘宝评论

        本文链接:https://www.haomeiwen.com/subject/zftktktx.html