Python抓取Google Trends（谷歌指数）

作者: SeanCheney | 来源:发表于2019-02-25 17:00 被阅读65次

Python抓取Google Trends（谷歌指数）
如何爬取 Google Trends 数据
Amazon营销-我就是爱干货，别叫我停下来
wish选品数据工具
11月PYPL排行榜，Python继续稳居冠军！
介绍9款跨境电商选品工具
Python翻译库 pygtrans
【20190127】值得关注的境外网站
没想到，谷歌数据揭示了xx-xx岁之间的人最难理解比特币！
黑猴子的家：为什么要学Python?

Pyppeteer暴力抓取Google trends：

import re
import time
import asyncio
from lxml import etree
from pyppeteer import launch

async def main():
    # headless参数设为False，则变成有头模式
    browser = await launch(
        # headless=False
    )
    page = await browser.newPage()
    await page.setViewport(viewport={'width':1280, 'height':800})
    await page.setJavaScriptEnabled(enabled=True)
    await page.goto('https://trends.google.com/trends/?geo=US')
    await page.type(selector='input#input-254', text='bitcoin')
    await asyncio.sleep(1) # 等待网页加载出来，懒得用条件判断了
    await page.keyboard.press('Enter')
    await asyncio.sleep(2)
    # print(await page.title())
    await page.goto('https://trends.google.com/trends/explore?date=now%207-d&q=bitcoin')
    await asyncio.sleep(2)
    content_text = await page.content()
    # print(content_text)
    res = re.findall(r'<table>.*</table>?', content_text, flags=0)[0]
    # print(res)
    tree = etree.HTML(res)
    values = tree.xpath('//table/tbody/tr')
    for item in values:
        timeformat = item.xpath('./td[1]/text()')[0].replace('\u202a','').replace('\u202c','')
        # print(timeformat)
        timeArray = time.strptime(str(time.localtime().tm_year) + ' ' + timeformat, "%Y %b %d at %H:%M %p")
        timestamp = int(time.mktime(timeArray))
        print(timestamp) # 时间戳
        score = item.xpath('./td[2]/text()')[0]
        print(score) # 分数

    await browser.close()

asyncio.get_event_loop().run_until_complete(main())

获得的是每相隔一小时的结果：

GitHub上的pytrends项目（https://github.com/GeneralMills/pytrends）也可以用来抓取，但是获取分数的请求url年久失修，不能获取到数据，其它比如获取相关词是好的。

网友评论

本文标题：Python抓取Google Trends（谷歌指数）

本文链接：https://www.haomeiwen.com/subject/vhbgyqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python抓取Google Trends（谷歌指数）

相关文章

Python抓取Google Trends（谷歌指数）

如何爬取 Google Trends 数据

Amazon营销-我就是爱干货，别叫我停下来

wish选品数据工具

11月PYPL排行榜，Python继续稳居冠军！

介绍9款跨境电商选品工具

Python翻译库 pygtrans

【20190127】值得关注的境外网站

没想到，谷歌数据揭示了xx-xx岁之间的人最难理解比特币！

黑猴子的家：为什么要学Python?

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读