Python 刷今日头条阅读量

作者: 简书用户9527 | 来源:发表于2018-03-06 23:54 被阅读79次

    因为一直在爬今日头条的数据

    在下午的时候,爬着爬着就不小心萌发出了刷今日头条文章阅读量的想法,该文章只适合技术交流,并不做商业用途

    也许爬过今日头条的战友们都知道,今日头条的_signature 一直不知道怎么获取,当然,我也是苦恼了一阵,但是后面还是把这个_signature这个值是从哪里取得的知晓了,但是,这个值的获取的文件用了7000行代码,算法那一块也是无从下手。emmm...... 扯远了,回归正题吧。

    该教程只适合新手,大牛就不用继续往下看了

    方法原理很简单,直接用了selenium+webdriver 这两个库

    下面贴上代码:

    import time
    
    import requests
    from selenium import webdriver
    
    
    def refresh_html(jianshu_url):
        chromedriver = "C:\Program Files (x86)\Google\chromedriver_win32\chromedriver.exe"
        browser = webdriver.Chrome(chromedriver)
        browser.get(jianshu_url)
        while True:
            time.sleep(1)
            browser.refresh()
    
    if __name__ == '__main__':
            url = 'https://www.toutiao.com/i6482646112527188494/'
            try:
                refresh_html(url)
            except:
                refresh_html(url)
    
    

    刷之前:

    image.png

    刷之后:

    image.png

    注意一点

    今日头条访问次数多的情况下对IP进行验证码验证的情况。

    相关文章

      网友评论

        本文标题:Python 刷今日头条阅读量

        本文链接:https://www.haomeiwen.com/subject/rsddfftx.html