美文网首页
《52讲轻松搞定网络爬虫》-个人笔记(一)

《52讲轻松搞定网络爬虫》-个人笔记(一)

作者: dyzzbao | 来源:发表于2020-02-28 13:35 被阅读0次

欢迎在下方留言、讨论

1、URI、URL和URN

URI(Uniform Resource Identifier):统一资源标志符

URL( Universal Resource Locator):统一资源定位符

URN(Universal Resource Name):统一资源名称

URN、URL是URI的子集,每个URL都是URI,但不是每个URI都是URL。

举例说明:http://vjs.zencdn.net/v/oceans.mp4 同时是URI、URN,URN是oceans.mp4 

2、(Hypertext)超文本

包含<p>\<video>\<div>\<img>\<a>等标签,共同构成网页源代码HTML

3、协议类型

常见的有:http/https、ftp、sftp、smb

其中HTTPS在HTTP(超文本传输协议)的基础上添加了SSL加密

4、GET、POST

GET常用于发起数据请求,比如获取数据库中的记录;POST常用于表单提交时,比如向数据库中插入一条新记录,当更新数据库记录时,会同时用到GET、POST请求。

GET、POST区别在于: 

1、GET请求包含在URL参数里;POST请求包含在请求体中而不体现在URL中

2、GET请求的上限是1024B;POST请求没有上限。

常见请求方法

5、相关知识

Network分析 General部分 请求头Request Headers 响应头Response Header 常见响应状态表

参考链接:

https://kaiwu.lagou.com/course/courseInfo.htm?courseId=46#/detail/pc?id=1662

https://www.runoob.com/http/http-methods.html

相关文章

网友评论

      本文标题:《52讲轻松搞定网络爬虫》-个人笔记(一)

      本文链接:https://www.haomeiwen.com/subject/vcbkhhtx.html