陆陆续续也加入爬虫小分队一段时间,近期也是工作时间的工作内容比较繁琐,抽不出一段连续的时间来做一些Python学习爬虫。
记得最迟爬的网站还是中国天气预报网,也一直在考虑用多线程或者多进程来实现,也是看过一些示例代码来实现,群里的小伙伴也是有做一些对比,都是学习的资料。
后期慢慢补上作业
- 东方财富网 多线程/多进程实现
- socom抓取数据清洗 csv文件可以用excel清洗 存入数据库的根据存入的数据库进行相应清洗 出一份企业分析报告,维度可以包括各省市地区企业数量,行业一级分布情况,注册资本各区间的分布情况等
- 爬取京东商品信息
网友评论