历史事件:
在1950~60这十年上下,就已经发明了互联网的雏形。不过当时并不是每个人都能访问,这个互联网只允许军方,政府和科研机构访问。是慢慢的才逐步向所有人开放的。但是,在1990年之前,互联网是没有网页这个东西的,那么当时人们上网都干些什么呢?
当时人们对互联网的使用主要集中在 Email。
1965 年,Email 被发明出来,成为互联网的「杀手级」应用,因为你可以瞬间发一封信给远方的人,不需要信纸、邮票和邮递员。
1971 年,用 @ 符号来表示 Email 的方法被发明出来。
1979 年,邮件讨论组被发明出来,人们可以在一个话题下公开地互发邮件。
当时的人们通过 FTP 来下载文件附件(FTP是一个软件)。
1980 年至 1990 年间,人们迫切需要一种更好的上网方式,很多方案被提出,如 HTTP 和 Gopher。后面的事情大家都知道了,HTTP 因为其易用性胜出。
当时的邮件内容全都是普通文本,或者是类 Markdown 形式的文本,人们需要一种超级文本用来做页面跳转,也就是我们现在见到的 <a> 标签,不过那时的人还没想到这一点,当时的超集文本方案有很多,HTML 只是其中之一,而且当时的 HTML 也非常简陋,只有 11 个标签。
1989~1992年这段时间,李爵士Tim Berners-Lee发明了WWW(world wide web),一种适用于全世界的网络。主要包含三个概念(关键技术):
1. 一个全球网络资源唯一认证的系统,统一资源标志符:URI;
2. 超文本标记语言:HTML;
3. 超文本传输协议:HTTP;(就是这个时候诞生的)
李爵士除了发明了这些概念,还付诸了行动:
发明了第一个服务器;
发明了第一个浏览器;
写出了第一个网页(info.cern.ch);
对于上面出现的一些英文缩写名词,下面文章统一解释。
名词解析:
URI (Uniform Resource Identifier),中文意思就是统一资源标志符。可分为URL和URN。是标识某一互联网资源名称的字符串。
URL(Uniform Resource Locator),中文意思就是统一资源定位符,顾名思义,我们想找到某个东西,就要通过地址或者具体方位到达指定位置去找。比如你想访问一个网站,就必须要在浏览器输入你想访问的那个网站的地址。URL就是我们俗称的网址,网址我们人人都用,所以它是URI最常见的一种形式。一个URL是由以下几个部分组成:传输协议,层级URL标记符号【//】,域名,路径,查询信息,端口号,锚点。
URN(Uniform Resource Name),中文意思就是统一资源名称。相比较URL,这个就比较麻烦了,打个比方,在中国每个公民都有独一无二的身份证号,或者你购买的汽车的车架号也是独一无二的再或者每本正常手续发行出来的书籍编号。这个能证明某个东西独一无二的编号就是URN。但是它与URL不同的是,我告诉你我的身份证号你能找到我吗(请不要人肉或报警)?显然不能,因为你只能知道有我这么一个人,却不知道我在哪。
DNS(Domain Name Syste)域名服务器,向DNS发送一个域名,它将给你返回一个IP。命令如下:
nslookup baidu.com
ping baidu.com
请求与响应:
server、client浏览器负责发起请求
服务器在 80 端口接收请求
服务器负责返回内容(响应)
浏览器负责下载响应内容
HTTP 的作用就是指导浏览器和服务器如何进行沟通。也就是说浏览器如何发送请求和服务器如何返回响应都是按照超文本传输协议来进行的,但是这两者的传输HTTP是不管的。
1.请求:
我们可以用浏览器进行HTTP请求,也可以用curl进行请求。
curl:
GET请求:
命令行:curl -s -v -H "xx:yyy" -- "http://www.baidu.com"
其中:curl(传输URL) -s(不要进度条) ;-v(显示请求和响应的信息) ;-H(添加/修改一个请求头,这个可以不要,同样也可以更改请求信息里面的一些类似键值对的东西,例如下图第二行,你可以改成淘宝的网址,但一般没什么用)
得到的请求信息见下图:
get一共六条信息:
1,GET(动词) /(路径) HTTP/1.1(协议与版本号)。
2 ,域名。(www.baidu.com)
3,你用的什么软件发送的请求。(crul)
4,代表你要接收所有的响应信息。
5,响应头的信息(命令行里面的-H "xxx.yyy")
6,就是一个回车(用于分隔开请求与响应)
post请求:
curl -X POST -d "1234567890" -s -v -H "ddd: xxx" -- "https://www.baidu.com"
其中-X POST(就是post请求,动词从get变成了post),-d(上传的内容)
得到的请求见下图:
post(不知道怎么回事,不显示第四部分也就是上传的内容)我们发现多了些内容,其中:
Content-Length: 10代表你提交的内容长度。
Content-Type:...........代表你提交的内容格式是什么。
我们总结一下提交的格式:
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
记住以下几点:
1.请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
2.第三部分永远都是一个回车(\n)
3.动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
4.这里的路径包括「查询参数」,但不包括「锚点」
5.如果你没有写路径,那么路径默认为 /
6.第 2 部分中的 Content-Type 标注了第 4 部分的格式
用浏览器(Chrome) 发请求:
打开 Network
地址栏输入网址
在 Network 点击,查看 request,点击「view source」
点击「view source」
如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
PS:GET请求同样可以用-d来上传一些信息,但是没有人会这么做,因为没有意义,因为GET就是为了获取一些东西,而POST就是要去上传一些东西。
2.响应:
上面两个的请求示例,前两个请求对应的响应分别为:
get响应 post响应GET 请求和 POST 请求对应的响应可以一样,也可以不一样
响应的第四部分可以很长很长很长
响应的格式:
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
状态码:
1xx 临时响应,这个不常用
2xx 表示成功
3xx 已重新定向,需要去其他位置访问,原网页已经不在这了
4xx 表示请求出错
5xx 表示服务器出错
状态解释没什么用
第 2 部分中的 Content-Type 标注了第 4 部分的格式
第 2 部分中的 Content-Type 遵循 MIME 规范
用 Chrome 查看响应:
打开 Network
输入网址
选中第一个响应
查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
你会看到响应的前两部分
查看 Response 或者 Preview,你会看到响应的第 4 部分
PS:超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式的数据加密,如果攻击者截取了Web浏览器和网站服务器之间的传输报文,就可以直接读懂其中的信息,因此,HTTP协议不适合传输一些敏感信息,比如:信用卡号、密码等支付信息。
为了解决HTTP协议的这一缺陷,需要使用另一种协议:安全套接字层超文本传输协议HTTPS,为了数据传输的安全,HTTPS在HTTP的基础上加入了SSL协议,SSL依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密。
网友评论