小爬虫

作者: Python野路子 | 来源:发表于2017-11-30 00:02 被阅读0次

注:本人菜鸟一枚,自学python,记录学习过程中所学所思,希望自己有所收获

__author__ = 'juehuan'
import requests
import json
import time


class cldata():
    def __init__(self):
        self.url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'
        self.header = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'}
        self.cookie = {
            'Cookie': 'JSESSIONID=02EF275A008A3ADEE700B04B543AE18E; JSESSIONID=A7FC968A8F43B9DA2EABBA61D72602CC'}
        self.f = open('食品.txt', 'w', encoding='utf-8')
        self.f.write('企业名称 | 许可证编号 | 发证机关 | 有效期至 | 发证日期\n')

    def get_cfda(self, page):
        self.data = {
            'on': True,
            'page': page,
            'pageSize': 15,
            'productName': '',
            'conditionType': 1,
            'applyname': '',
            'applysn': ''
        }
        self.html = requests.post(self.url, data=self.data, headers=self.header, cookies=self.cookie)
        datas = self.html.json()
        for i in datas['list']:
            self.write_cfda(i)

    def write_cfda(self, company):
        try:
            self.f.write('%s | %s | %s | %s | %s\n' % (
                company['EPS_NAME'], company['EPS_NAME'], company['QF_MANAGER_NAME'],
                company['XK_DATE'], company['XC_DATE']))
        except:
            print('写入错误')

    def close(self):
        self.f.close()


if __name__ == '__main__':
    start_time = time.time()
    cfda = cldata()
    for i in range(1, 271):
        cfda.get_cfda(i)
    cfda.close()
    end_time = time.time()
    print('total time :', end_time - start_time)

总结:涉及面向对象(self)、爬虫requests的post方式、列表等知识点;

相关文章

  • 数据科学实践与学习索引

    Python 包 pandas 爬虫 小专栏—爬取广州二手房信息小专栏—爬虫模块化小专栏—广度优先爬虫小专栏—爬取...

  • 小红书小程序爬虫抓包分析

    小红书 小程序爬虫 小红书爬虫 小红书是有 APP 和 小程序两个入口。今天介绍小红书小程序的爬虫。 主要流程是以...

  • Python实践与学习索引

    爬虫小专栏—爬取广州二手房信息小专栏—爬虫模块化小专栏—广度优先爬虫小专栏—爬取某个用户的所有微博包简书—pandas

  • Python+PhantomJS+selenium+Beauti

    Python+PhantomJS+selenium+BeautifulSoup实现简易网络爬虫 简易网络小爬虫,目...

  • 小爬虫

    注:本人菜鸟一枚,自学python,记录学习过程中所学所思,希望自己有所收获 总结:涉及面向对象(self)、爬虫...

  • 小爬虫

    好久没有在简书写东西了。主要是感觉这个写东西不太方便orz...看到之前博客的评论,大家还是对爬虫比较感兴趣,所以...

  • 简单Python小爬虫

    简单Python小爬虫https://scrapy.org/

  • python模拟登陆urp教务处抓取课表

    前段时间小编写了一篇利用爬虫做词云分析的帖子,有粉丝反馈说想进一步学习爬虫,所以小编今天就用爬虫模拟登陆学校的教务...

  • 2020-02-01 python 爬虫小练习-下载“百度”图片

    1.python 爬虫小练习 #爬虫import requests#第三方库url="http://www.bai...

  • 学会运用爬虫框架 Scrapy (一)

    对于规模小、爬取数据量小、对爬取速度不敏感的爬虫程序, 使用 Requests 能轻松搞定。这些爬虫程序主要功能是...

网友评论

      本文标题:小爬虫

      本文链接:https://www.haomeiwen.com/subject/upjmbxtx.html