《从零开始学Python网络爬虫》概要

作者: OzanShareing | 来源:发表于2018-08-29 16:15 被阅读0次

概要

本文集详解网络爬虫的原理、工具、框架和方法。

详解从简单网页到异步加载网页，从简单存储到数据库存储，从简单爬虫到框架爬虫等技术。

类别：

引子

随着Internet的飞速发展，互联网中每天都会产生大量的非结构化数据。如何从这些非结构化数据中提取有效信息，供人们在学习和工作中使用呢？这个问题促使网络爬虫技术应运而生。

由于Python语言简单易用，而且还提供了优秀易用的第三方库和多样的爬虫框架，所以使得它成为了网络爬虫技术的主力军。

近年来，大数据技术发展迅速，数据爬取作为数据分析的一环也显得尤为重要。程序员要进入与数据处理、分析和挖掘等相关的行业，就必须要掌握Python语言及其网络爬虫的运用。

第 12 章 Scrapy爬虫框架
本章主要介绍了Windows 7环境中的Scrapy安装和创建爬虫项目的过程，并通过案例详细讲解了各个Scrapy文件的作用和使用方法，而且通过多个综合案例讲解了如何通过Scrapy爬虫框架把数据存储到不同类型的文件中，最后讲解了如何编写跨页面网站的爬虫代码。

网友评论

本文标题：《从零开始学Python网络爬虫》概要

本文链接：https://www.haomeiwen.com/subject/tekkwftx.html