美文网首页
HTTP入门

HTTP入门

作者: 7058fef01543 | 来源:发表于2017-10-12 09:48 被阅读0次
  • WWW万维网
  • 请求与响应
  • HTML简介

WWW万维网

英国科学家Tim Berners-Lee(蒂姆·伯纳斯-李)于1989年发明了万维网。其他的没想好介绍些什么,先介绍些概念吧。

URI 是什么

URI-维基百科
统一资源标识符(英语:Uniform Resource Identifier,或URI)是一个用于标识某一互联网资源名称的字符串。
URI分为URL和URN,我们一般使用URL作为网址。

URL

URL-维基百科
统一资源定位符(或称统一资源定位器/定位地址URL地址等,英语:Uniform Resource Locator,常缩写为URL),有时也被俗称为网页地址网址)。

URL格式
方方的URL例子

URN

统一资源名称(英语:Uniform Resource Name,或URN)
用于标识唯一书目的ISBN系统是一个典型的URN使用范例。如:ISBN:9787106026073 就是一个独一无二的标识。

与URL和URN的关系

URI可被视为定位符(URL),名称(URN)或两者兼备。统一资源名(URN)如同一个人的名称,而统一资源定位符(URL)代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。

DNS

域名系统(英文:Domain Name System,缩写:DNS)是互联网的一项服务。它作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。

  • 输入域名
  • 输出IP
nslookup baidu.com
ping baidu.com

请求与响应

HTTP 的作用就是指导浏览器和服务器如何进行沟通


方方的浏览器与服务器的交互
  • 浏览器负责发起请求
  • 服务器在 80 端口接收请求
  • 服务器负责返回内容(响应)
  • 浏览器负责下载响应内容

请求

请求示例

curl -s -v -H "XXX: xxx" -- "https://www.baidu.com"

请求的内容为

GET / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.44.0
Accept: */*
XXX: xxx


curl -X POST -s -v -H "XXX: xxx" -- "https://www.baidu.com"

请求的内容为

POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.44.0
Accept: */*
XXX: xxx


 curl -X POST -d "1234567890" -s -v -H "XXX: xxx" -- "https://www.baidu.com"

请求的内容为

POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.44.0
Accept: */*
XXX: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded

1234567890

<!-- GET请求 -->
curl -s -v -H "XXX: xxx" -- "https://www.baidu.com"
<!-- POST请求 -->
curl -X POST -s -v -H "XXX: xxx" -- "https://www.baidu.com"
<!-- 带数据的POST请求 -->
curl -X POST -d "1234567890" -s -v -H "XXX: xxx" -- "https://www.baidu.com"

以上三条命令中XXX: xxx是可以自定义的内容

请求的格式

1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3 
4 要上传的数据
  1. 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
  2. 第三部分永远都是一个回车(\n)
  3. 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
  4. 这里的路径包括「查询参数」,但不包括「锚点」
    如果你没有写路径,那么路径默认为 /
  5. 第 2 部分中的 Content-Type 标注了第 4 部分的格式

用 Chrome 发请求

  1. 打开 Network
  2. 地址栏输入网址
  3. 在 Network 点击,查看 request,点击「view source」
  4. 点击「view source」
  5. 点击「view source」
  6. 终于点了?可以看到请求的前三部分了
  7. 如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到

响应

请求了之后,应该都能得到一个响应,除非断网了,或者服务器宕机了。
前面3个请求中第一个请求的响应

HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: Keep-Alive
Content-Length: 2443
Content-Type: text/html
Date: Thu, 12 Oct 2017 01:02:34 GMT
Etag: "58860411-98b"
Last-Modified: Mon, 23 Jan 2017 13:24:33 GMT
Pragma: no-cache
Server: bfe/1.0.8.18
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/

<!DOCTYPE html>
<!--STATUS OK--><html> <head> 后面太长,省略了……

前面3个请求中后2个请求的响应

HTTP/1.1 302 Found
Connection: Keep-Alive
Content-Length: 17931
Content-Type: text/html
Date: Thu, 12 Oct 2017 01:06:08 GMT
Etag: "54d9748e-460b"
Server: bfe/1.0.8.18

<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8"> 后面太长,省略了……
  1. GET 请求和 POST 请求对应的响应可以一样,也可以不一样
  2. 响应的第四部分可以很长很长很长

响应的格式

1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
  • 状态码需要背,是服务器对浏览器作出的回应
    • 1xx消息 这一类型的状态码,代表请求已被接受,需要继续处理(不常用)
    • 2xx成功 这一类型的状态码,代表请求已成功被服务器接收、理解、并接受
    • 3xx重定向 这类状态码代表需要客户端采取进一步的操作才能完成请求
    • 4xx客户端错误 这类的状态码代表了客户端看起来可能发生了错误,妨碍了服务器的处理
    • 5xx服务器错误 表示服务器无法完成明显有效的请求
  • 第 2 部分中的 Content-Type 标注了第 4 部分的格式
  • 第 2 部分中的 Content-Type 遵循 MIME 规范

用 Chrome 查看响应

  1. 打开 Network
  2. 输入网址
  3. 选中第一个响应
  4. 查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
  5. 你会看到响应的前两部分
  6. 查看 Response 或者 Preview,你会看到响应的第 4 部分

参考资料:

  1. 万维网-维基百科
  2. 饥人谷-HTTP入门

相关文章

  • 入门:HTTP入门

    问题 1.HTTP 请求包括哪些部分2.HTTP 响应包括哪些部分3.如何用Chrome开发者工具查看 HTT...

  • 爬虫入门系列(六):正则表达式完全指南(下)

    爬虫入门系列目录: 爬虫入门系列(一):快速理解HTTP协议 爬虫入门系列(二):优雅的HTTP库requests...

  • HTTP入门

    HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准。通过使用网页浏览器、网络爬虫或者其它的工具,客...

  • http入门

    http 简介 http 历史 1989, 蒂姆。伯纳斯-李在CERN发起 1999年6月,IETF(互联网工程小...

  • http入门

    一、URI 是什么 全程:统一资源标识符,俗称网址 URI 分为 URL 和 URN URN Google URN...

  • HTTP入门

    基本概念 三个基本概念 URI:统一资源资源标志符(Uniform Resource Identifier) HT...

  • HTTP入门

    博主最近在复习HTTP,之前用书主要是《计算机网络》谢希仁版本和上野宣的《图解HTTP》,最近结合网上博客,进行复...

  • http入门

    一,http请求包括: 1 动词 路径 协议/版本 2 Key1: value1 2 Key2: value2 2...

  • HTTP入门

    浏览器负责发起请求 服务器在80端口接收请求 服务器负责返回内容(响应) 浏览器负责下载响应内容HTTP的作用就是...

  • http入门

    图中: 浏览器负责发起“请求”。 服务器在80端口接受“请求”。 服务器负责返回内容(响应)。 浏览器负责下载响应...

网友评论

      本文标题:HTTP入门

      本文链接:https://www.haomeiwen.com/subject/oddnyxtx.html