python部分

使用的包：urllib2

代码：

import urllib2
request = urllib2.urlopen(url = 'https://movie.douban.com/?_t_t_t=0.6509884103763016',timeout =5)
body = request.read()

遇到的问题：

获得的body为unicode编码，中文不见了，变成\xe5\x9b\xbd\xe4\xba\xa7\xe5\x8a，腰子好痛

html

html常见元素

<html>
<body>
<h> 标题 </h>
<p> 段落
<a> 链接
<img> 图像

换行，可以没有结束标签

图片.png

标签参考手册

html属性

eg:

<a href="http://www.runoob.com">这是一个链接</a>

属性参考手册

[Scrapy] 爬虫学习记录：Day1
python部分使用的包：urllib2 代码：遇到的问题：获得的body为unicode编码，中文不见了，...
python爬虫从入门到放弃之十三：Scrapy概念和流程
———为什么要学习Scrapy？ Scrapy是爬虫框架，并发性好，性能较高，适合较大的爬虫需求。 Scrapy不...
Scrapy爬虫学习记录
昨天休息的时候偶然发现了一个的球鞋网站，上面有很多关于球鞋的资讯。于是，决定现学现卖，学习scrapy把数据都给爬...
Mac 安装Scrapy
刚学习完Python，准备使用Scrapy练习爬虫。记录一下，在Mac环境下安装Scrapy的步骤及初始工程。打...
Scrapy 1.4 + Python 3.6模拟登陆知乎
最近学习Python爬虫，用到了Scrapy这个爬虫框架。目前Scrapy的最新版本已经达到了Scrapy 1.4...
一篇文章教会你理解Scrapy网络爬虫框架的工作原理和数据采集过
今天小编给大家详细的讲解一下Scrapy爬虫框架，希望对大家的学习有帮助。 1、Scrapy爬虫框架 Scrapy...
Python学习-Scrapy爬虫专题
手册目的专门记录使用Scrapy爬虫学习过程中的各种坑IDE Anaconda，python 3.6 Scrap...
Scrapy学习笔记
学习初步使用基本使用 scrapy 问题记录：运行爬虫出现 500 错误：解决办法：设置 settings....
Pycharm+Scrapy框架运行爬虫糗事百科（无items数
scrapy爬虫框架 qsbk.py 爬虫代码 import scrapy'''scrapy框架爬虫流程：发送请求...
Scrapy 爬虫框架学习记录
打算做一个小小的项目，用于下载论文，所以先学学爬虫的一些相关知识。创建项目安装完 scrapy 后，新建一个爬...