URI(Uniform Resource Identifier)
统一资源标识符,俗称网址
URI 分为 URL 和 URN,我们一般使用 URL 作为网址。
URN(Uniform Resource Name)
唯一确定的一个名称
例如,ISBN: 9787115275790 就是一个 URN,通过 URN 你可以确定一个「唯一的」资源,ISBN: 9787115275790 对应的资源的是《JavaScript 高级程序设计(第三版)》这本书。你去是介绍任何一个图书馆、书店,他们都知道是这本书。
URL(Uniform Resource Locator)
唯一确定一个位置
例如,https://www.baidu.com/s?wd=hello&rsv_spt=1#5 就是一个 URL,通过 URL 你可以确定一个「唯一的」地址(网址)。
URL的常见组成注意:
- www.baidu.com 和 baidu.com 是两个不同的域名,前者是一个三级域名,后者是一个两级域名,它们共有一个二级域名 baidu.com。
- 图中并没有包括「端口」,完整的 URL 包括:协议、域名、端口号、路径、查询字符串、锚点
DNS(Domain Name System)
域名系统,作用是
- 输入域名
- 输出对应的 IP
nslookup baidu.com
ping baidu.com
问:如果想让 baidu.com 域名指向 127.0.0.1 这个 IP 应该怎么做?
答:修改本地 hosts 文件,设置 127.0.0.1 baidu.com
修改本地hosts的IPServer + Client + HTTP
服务器与浏览器的交互- 浏览器负责发起请求
- HTTP 的默认服务端口是 80,服务器在 80 端口接收请求
- 服务器负责返回内容(响应)
- 浏览器负责下载响应内容
HTTP 的作用就是指导浏览器和服务器如何进行沟通。
总的来说,URL 的作用是能让你访问一个页面,HTTP 的作用是让你能下载这个页面,HTML 的作用是让你能看懂这个页面。
请求示例
- 输入
curl -s -v -H "zzzzzzz: xxx" -- "https://www.baidu.com"
用 curl 创造一个 get 请求,并得到响应
请求的内容为
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.64.0 用什么软件发起的响应
> Accept: */* 接受返回的任何内容
> zzzzzzz: xxx
>
- 输入
curl -X POST -s -v -H "zzzzzzz: xxx" -- "https://www.baidu.com"
请求的内容为
> POST / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.64.0
> Accept: */*
> zzzzzzz: xxx
>
- 输入
curl -X POST -d "1234567890" -s -v -H "zzzzzzz: xxx" -- "https://www.baidu.com"
请求的内容为
> POST / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.64.0
> Accept: */*
> zzzzzzz: xxx
> Content-Length: 10 上传的内容的长度
> Content-Type: application/x-www-form-urlencoded 上传的内容的类型
>
1234567890 要上传的数据或文件
这里简单说一下 get 和 post 的区别:
- get 为获取内容/信息
- post 为上传内容/信息
- 用 get 来上传内容,一般服务器不接受
get 和 post 本质上都是 TCP 链接,并无差别。但是由于 HTTP 的规定和浏览器/服务器的限制,导致他们在应用过程中体现出一些不同。详细内容见文章 get 和 post 的区别
请求的格式
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
注意:
- 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
- 第三部分永远都是一个回车(\n)
- 动词有 GET(获取)、POST(上传)、PUT(整体更新)、PATCH(局部更新)、DELETE、HEAD、OPTIONS 等
- 这里的路径包括「查询参数」,但不包括「锚点」
- 如果你没有写路径,那么路径默认为 /
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- HTTP,两个电脑之间传输内容的协议
- HTML,超级文本,主要用来做页面跳转
用 Chrome 发请求
- 打开 Network
- 地址栏输入网址
- 在 Network 点击,查看 request,点击「view source」
- 点击「view source」
- 如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
响应示例
上面三个请求示例,前两个请求对应的响应分别为
< HTTP/1.1 200 OK
< Accept-Ranges: bytes
< Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
< Connection: Keep-Alive
< Content-Length: 2443
< Content-Type: text/html
< Date: Sun, 11 Aug 2019 03:53:06 GMT
< Etag: "5886041d-98b"
< Last-Modified: Mon, 23 Jan 2017 13:24:45 GMT
< Pragma: no-cache
< Server: bfe/1.0.8.18
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<
<!DOCTYPE html>
<!--STATUS OK--><html> <head> 后面太长,省略了……
< HTTP/1.1 302 Found
< Connection: Keep-Alive
< Content-Length: 17931
< Content-Type: text/html
< Date: Sun, 11 Aug 2019 03:59:13 GMT
< Etag: "54d9749e-460b"
< Server: bfe/1.0.8.18
<
<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8"> 后面太长,省略了……
注意:
- GET 请求和 POST 请求对应的响应可以一样,也可以不一样
- 响应的第四部分可以很长很长很长
响应的格式
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
注意:
- 状态解释没什么用
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- 第 2 部分中的 Content-Type 遵循 MIME 规范
状态码------是服务器对浏览器说的话
- 1xx ——信息,服务器收到请求,需要请求者继续执行操作(不常用)
- 2xx ——成功,操作被成功接收并处理
200(成功)服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页,一般用于 GET 与 POST 请求。
204(无内容)服务器成功处理了请求,但没有返回任何内容。 - 3xx ——重定向,需要进一步的操作以完成请求
301(永久移动)请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
302(临时移动)服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。
304(未修改)自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。 - 4xx ——客户端错误,请求包含语法错误或无法完成请求
404(未找到)服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面 - 5xx ——这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。
500(服务器内部错误)服务器遇到错误,无法完成请求。
502(错误网关)服务器作为网关或代理,从上游服务器收到无效响应。
用 Chrome 查看响应
- 打开 Network
- 地址栏输入网址
- 选中第一个响应
- 查看 Response Headers,点击「view source」
- 你会看到响应的前两部分
- 查看 Response 或者 Preview,你会看到响应的第 4 部分
网友评论