爬取亚马逊搜索关键词,结果数量

作者: 一斩z | 来源:发表于2018-05-18 21:12 被阅读97次

爬取亚马逊搜索关键词,结果数量
A9算法更新了，但卖家莫慌
网络爬虫实战(5个案例)
1、什么是搜索引擎
requests库网络爬取实战
爬虫系列——使用scrapy爬取京东的商品以及评论信息
入门级爬虫（2）
爬取搜狗搜索的结果
最实时、准确的亚马逊关键词分析方法!
Python商品数据预处理与K-Means聚类可视化分析

帮朋友写的一个亚马逊关键词搜索结果,用request跟beautiful爬下来是一堆乱码,不知道怎么解析,最后用selenium实现自动化抓取,效率较慢。

环境：python 3

要求：

抓取每个关键词的结果数是多少

思路：

自动化打开窗口；
拼接关键词链接；
用selenium抓取,id：s-result-count,文本内容
存储到本地

代码实现：

#coding = utf - 8
from selenium import webdriver
import os
import time

#url跳转链接
baseUrl = 'http://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords='
offSet = ['ceramic knife set','dogs','pet','towel','bathroom','paper','quilt','glass','Skate']

#启动浏览器
chromedriver = "F:\\Anaconda\Lib\\site-packages\\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
browser = webdriver.Chrome(chromedriver)
#browser.get("https://www.baidu.com/")

#循环获取link
i = 0
for key_word in range(len(offSet)):
    print(i)
    #time.sleep(10)
    #url
    try:
        browser.get(baseUrl+offSet[i])
        #selenium find id元素
        content = browser.find_element_by_id('s-result-count').text
        #time.sleep(15)
        resultFile = open("F:\\amazon_keyword.txt","a")
        resultFile.write(content +"\n")
        resultFile.close()
    except:
        print('Error')
        #browser.close()
    i += 1

总结：刚开始由于网络原因,一直延时抓取,提示错误,用了try想找出异常,接了网线后才发现是网络原因-

网友评论

我爱编程

本文标题：爬取亚马逊搜索关键词,结果数量

本文链接：https://www.haomeiwen.com/subject/fosndftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

爬取亚马逊搜索关键词,结果数量

要求：

思路：

代码实现：

相关文章

爬取亚马逊搜索关键词,结果数量

A9算法更新了，但卖家莫慌

网络爬虫实战(5个案例)

1、什么是搜索引擎

requests库网络爬取实战

爬虫系列——使用scrapy爬取京东的商品以及评论信息

入门级爬虫（2）

爬取搜狗搜索的结果

最实时、准确的亚马逊关键词分析方法!

Python商品数据预处理与K-Means聚类可视化分析

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

我爱编程