美文网首页每日爬虫
2019-11-16 qq音乐评论

2019-11-16 qq音乐评论

作者: 一只失去梦想的程序猿 | 来源:发表于2019-11-16 15:49 被阅读0次

目标网址:https://y.qq.com/n/yqq/song/001qvvgF38HVc4.html#comment_box
qq音乐 周杰伦的说好不哭
打开charles,刷新网页,复制评论在charles里查找,很容易找到评论接口

image.png
https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg?g_tk=160454710&loginUin=1808163167&hostUin=0&format=json&inCharset=utf8&outCharset=GB2312&notice=0&platform=yqq.json&needNewCode=0&cid=205360772&reqtype=2&biztype=1&topid=237773700&cmd=8&needmusiccrit=0&pagenum=0&pagesize=25&lasthotcommentid=&domain=qq.com&ct=24&cv=10101010

评论翻页,发现只有page,lasthotcommentid参数改变了,page即页数,lasthotcommentid为最后一条评论id

https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg?g_tk=160454710&loginUin=1808163167&hostUin=0&format=json&inCharset=utf8&outCharset=GB2312&notice=0&platform=yqq.json&needNewCode=0&cid=205360772&reqtype=2&biztype=1&topid=237773700&cmd=8&needmusiccrit=0&pagenum=1&pagesize=25&lasthotcommentid=song_237773700_3559701714_1573875409&domain=qq.com&ct=24&cv=10101010

于是直接循环请求:

page=0
lasthotcommentid=''
while 1:

    url='https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg?g_tk=160454710&loginUin=1808163167&hostUin=0&format=json&inCharset=utf8&outCharset=GB2312&notice=0&platform=yqq.json&needNewCode=0&cid=205360772&reqtype=2&biztype=1&topid=237773700&cmd=8&needmusiccrit=0&pagenum=%s&pagesize=25&lasthotcommentid=%s&domain=qq.com&ct=24&cv=10101010'%(page,lasthotcommentid)
    response=requests.get(url,verify=False)
    jsno_data=json.loads(response.text)
    print(jsno_data)
    commentsArr=jsno_data['comment']['commentlist']
    commenttotal=jsno_data['comment']['commenttotal']
    print('共有%s条评论'%commenttotal)
    page+=1
    break

评论格式如图,处理评论并保存


image.png
def saveComments(commentsArr):
    for comment in commentsArr:
        nick=comment['nick']
        rootcommentcontent=comment['rootcommentcontent']
        compile=re.compile(r'\[em].*[/em].',re.S)
        c=re.sub(compile,'',rootcommentcontent)
        f.write(nick+'----'+c+'\n')

结果:

image.png
完整代码:https://github.com/Liangjianghao/everyDay_spider.git qqMusic_comments

相关文章

  • 2019-11-16 qq音乐评论

    目标网址:https://y.qq.com/n/yqq/song/001qvvgF38HVc4.html#comm...

  • qq音乐评论

    走在安妮的仙境中,在满是寂静之声的风居住的街道,看着雨的印记洒满天空之城,听着秋日的私语,想起故乡的原风景和那场在...

  • 爬虫:QQ音乐评论

    QQ音乐评论 有些小伙伴反馈,对于爬虫的完整流程,还是不清楚,这边就按顺序,给大家梳理一下 反爬 首先查看一下,我...

  • QQ音乐评论02

    一个人厚着脸皮没羞没躁地去爱另一个人的概率一生只有一次。 男生错过了自己想要娶的女生就会变得随意;女生错过了自己想...

  • QQ音乐评论03

    这世上,所有的“突然想起”,都是“一直放在心底”。 我告诉你我喜欢你,并不是一定要和你在一起,而是希望今后的你,灰...

  • QQ音乐评论01

    自古评论出人才,QQ音乐不例外。喜欢记录和分享,评论里故事有三则。请君欣赏。你品,你细品,它有些悠长。 一 以前高...

  • 爬虫笔记(二)——爬取动态网页

    以爬取qq音乐评论为例 qq音乐评论链接 动态网页中的部分数据并不在返回的HTML文件中,因此按照静态网页的爬取方...

  • python爬虫实战之QQ音乐评论爬取

    本次爬取的是QQ音乐的评论信息,作为一名基本不看评论的人,真的羞愧难当。不过音乐嘛,听听就不错啦,哪有闲情雅致去看...

  • 我听英文歌《Here With You》的感受

    本文首发于QQ音乐,用户80548571清水秋的QQ音乐评论。 这首歌曲,我从它的配乐到旋律,发自内心感受到了欢快...

  • 不止网易有神评论

    以下评论皆收集于QQ音乐《Geisha》的评论,侵权致歉。 1.女孩睡醒玩手机,收到男孩发来一条信息:我要去跟我喜...

网友评论

    本文标题:2019-11-16 qq音乐评论

    本文链接:https://www.haomeiwen.com/subject/inyyictx.html