美文网首页HTTP & HTTPS & TCP
TCP/IP协议族边学边想

TCP/IP协议族边学边想

作者: Nemocdz | 来源:发表于2017-08-22 03:32 被阅读75次

    写在前面

    最近读了《图解TCP/IP》这本书,重新理解了大二囫囵吞枣,应付考试而学习的“计算机网络”和“TCP/IP”这两门课中一些未理解的知识,和疑惑的问题。

    网络基础

    OSI七层模型

    • 物理层-0和1代表高低电压,物理网络设备规格
    • 数据链路层-数据帧和比特流转换
    • 网络层-地址管理和路由选择
    • 传输层-连接节点之间的数据传输
    • 会话层-通信管理
    • 表示层-数据格式转换
    • 应用层-针对应用定制

    TCP/IP:定义了数据链路层以上的协议,包括网络层、传输层、应用层(会话层以上都包括)

    网络层

    网络层只关心起终点的整体传输,数据链路层关心每一个设备间的传输。

    IP(Internet Protocol)

    Q:IP为何面向无连接?

    A:1.简化 2.提速 3.为上层提供自定义

    IP寻址

    IP地址=网络标识+主机标识

    Q:如何确定网络标识位数?

    A:IP分类(传统ABCD)或子网掩码来划分

    路由控制

    指明IP包的下一跳路由,用路由控制表保存信息。

    形成方式

    • 静态路由控制(管理员手动设置)
    • 动态路由控制(和其他路由器交换信息自动刷新,受到“路由协议”控制)

    路由聚合:多个子网掩码对外呈现同一网络地址,减少路由表条目

    Q:0.0.0.0/0,IP地址/32,127.0.0.1分别是什么意思?

    A:

    1. 代表默认路由,路由表中任意的地址都能和它匹配,并不是一个IP地址(IP地址应标识为0.0.0.0/32)。匹配不到的都走默认路由。在家用路由器中用来描述Internet上所有的路由从而不用存储所有路由。
    2. 代表主机路由,所有位都参与路由,代表某一个主机的唯一路由。可用于匹配家用路由器的默认路由的寻找。
    3. 代表环回地址,同一计算机内的网络通信的本地默认地址,数据不会被流向网络。
    IP包的分割和重组

    在发送端和路由根据每段链路的MTU进行分片,接收端进行重组。

    Q:为何传输过程需要分割数据包?

    A:因为每种数据链路中的MTU(Max Transfer Unit,最大传输单元)各不相同

    Q:为何只在接收端而不在途中重组?

    A:

    1. 无法保证分片在同一路径传输
    2. 分片可能丢失
    3. 可能之后还需要重新分片

    分片机制的不足之处

    • 路由器负荷加重
    • 丢失某一分片整个IP包报废
    路径MTU发现

    先获取整个路径中数据链路的最小MTU,发送端按照这个MTU分片

    工作原理:

    1. 先设置IP包禁止分片
    2. 发送并在丢弃时(说明包MTU过大)将当时可最大的MTU用ICMP不可达消息返回
    3. 设置包MTU为ICMP返回的MTU并重新循环上述步奏,直到无ICMP返回
    IPv6

    特点:

    • 地址扩大,路由控制表的聚合
    • 性能提升:不校验首部,简化首部建构
    • 即插即用:无DHCP也可以实现自动分配IP
    • 认证和加密:IPsec
    • 多播和Mobile IP

    DNS(Domain Name System)

    将域名解析成IP。

    各个域的分层有对应的域名服务器,像树一样连接分层,分别可以解析对应域名的IP。

    工作原理:

    1. 查询时先向该域内的域名服务器A查询
    2. 域名服务器A从下至上找到根域名服务器
    3. 根域名服务器再从上往下找到对应的域名服务器B地址并返回给域名服务器A
    4. A向B查询域名的IP地址并返回

    ARP(Address Resolution Protocol)

    通过目标IP地址定位下一个接收的网络设备MAC地址。分为请求和响应两部分。一般获取到Mac地址后会缓存一段时间。

    ICMP(Internet Control Message Protocol)

    主要功能

    • 确认IP包是否成功送达
    • 通知被废弃的具体原因

    主要类型包括:目标不可达、重定向、超时、回送(Ping命令)

    DHCP(Dynamic Host Configuratin Protocol)

    为主机自动设置IP地址和统一管理IP地址分配。

    工作原理:

    1. 发送DHCP发现包(目标地址广播,源地址未知),请求网络设置(IP地址和子网掩码等)
    2. DHCP服务器返回可使用的网络设置
    3. 发送DHCP请求包(目标地址广播,源地址未知),通知想要应用该网络设置
    4. DHCP服务器通知允许应用该设置

    Q:为什么需要第二次通知和确认设置?

    A:DHCP服务器的可分配目标地址可被管理员设置,二次确认可保证即使被重复的设置后也可以正常工作

    Q:为什么DHCP服务器分配IP地址前发送ICMP、客户端应用获得的IP地址发前送ARP请求?

    A:确认无返回应答从而检查IP地址是否可用,DHCP服务器发送ICMP是因为服务器少于客户端,ICMP速度更快,也不需要关心Mac地址

    NAT(Network Address Translator)

    用于将局域网中私有地址转换为全局IP地址的技术。

    通过NAT路由器中维护一张自动生成的用来转换地址的表。

    不同的内网主机可通过NAPT(Network Address Ports Translator)技术包含端口号一起转换。

    IPv4和IPv6转换也可通过相关技术NAT-PT和NAPT-PT来实现

    不足之处:

    • 无法从NAT外部向内部建立连接
    • 转换表生成和转换有开销
    • 一旦异常需要重新启动时所有TCP连接会被重置

    解决方式:IPv6或NAT穿透

    IP隧道

    在网络层首部后面继续追加网络层首部的通信方式

    传输层

    传输层通过端口号标识请求发送给哪一个应用程序的守护进程(对消息进行监听)。

    标识唯一的通信的要素:源IP、目标IP、源端口号、目标端口号、协议号

    UDP(User Datagram Protocol)

    面向无连接的通信,不保证通信可靠,不负责丢包重发等。

    主要用于高速传输和实时性要求较高的通信或广播:

    • 包总量小(DNS等)
    • 视频音频等多媒体通信(即时通信)
    • 限定于LAN等特定网络
    • 广播、多播通信

    TCP(Transmission Control Protocol)

    面向连接的通信,对传输、发送、通信进行控制,尽量保证通信可靠。

    特点:通过序列号和确认应答(ACK)

    Q:序列号作用是?

    A:确认应答在途中被丢弃或者延迟到达,导致进行多次重传相同数据。序列号定义后可在确认应答中将下个应该发送的序列号带上,保证下次发送的是正确的。

    Q:超时重发如何确定?

    A:每次计算往返时间(RTT,Round Trip Time)和偏差(抖动值)相加并稍大一点。

    Q:什么是Socket?

    A:操作系统对TCP协议族封装开放的一组操作API,如Listen,Accept,Send,Write,Read,Connect,Create等。

    TCP连接建立和断开

    设计思想我个人总结是:一次请求对应一次应答,客户端和服务端都需要进行请求

    Q:为啥建立连接是三次握手?

    A:首先这三个包分别是

    1. 客户端的请求(建立连接)
    2. 客户端请求的应答+服务端请求 (建立连接)
    3. 服务端请求的应答

    也就是中间那个包实际上包含两个功能。

    客户端和服务端都需要请求是因为建立连接前,两端配置(比如序列号)需要协商同步

    1. 同步信号需要一个返回确保成功,所以就有了请求的应答。
    2. 单纯一边的请求和应答并不能保证另一边也达到同步,所以就需要两边都请求。

    而三个包则是满足以上两个条件的最小数字

    Q:三次握手第三次失败了怎么办?

    A:这时客户端已经进入Established状态,ACK若丢失并超时,服务端尝试重新发送(默认次数为5),间隔1秒开始,每次是前一次的2倍。若还未响应,则服务端会关闭连接。之后客户端向服务端发包,服务端则用RST(Reset)包回应告知错误,防止SYN洪泛攻击(不断向服务器建立半连接而不确认使服务器不断重发ACK消耗服务器资源)。

    Q:为啥断开连接是四次挥手?

    A:把步骤2拆开了,因为被动方不一定已经做好了断开的准备。

    Q:四次挥手第四次失败了怎么办?

    A:最后一个ACK发送后,主动请求一方会进入TIME_WAIT状态,等待2MSL(Maximum Segment Lifetime)后才进入CLOSE状态。被动方可在此时间内重发ACK,来尽可能确保最后一个ACK送达。

    TCP窗口

    每个请求包对应一个应答会随着数量增大和往返时间增长性能降低。

    所以不需要每个包对应一个应答,而是以一个更大的单位。

    窗口表示某些连续的包的集合,大小为无需确认应答而可以继续发送的最大值。

    窗口需要缓存整个窗口的数据避免有一部分需要重传,直到收到应答后才可清除缓存。

    Q:为何需要滑动窗口?

    A:滑动窗口是指收到应答后将窗口滑动到确认应答里的序列号的位置。

    • 可以迅速使后面进入窗口范围的数据也可同时发送,提高性能。
    • 在收到包而应答丢失的情况,收到后面的应答可以表示之前的包收到了,滑动避免重传

    Q:为何需要快速重传?

    A:快速重传是指连续收到三次序号一致的之前序号应答后直接重传。因为丢失某个包后,后面的包也在窗口内所以也发送出去,此时会收到多次之前丢失包序号的应答,而不需要超时等待。之所以是三次参见链接

    Q:TCP粘包是什么?

    A:由于TCP是流协议,发送方后一包的头紧接着前一包的尾,粘成一包。

    发送方原因:上个确认才发下个并且确认时一起发送
    
    接收方原因:先缓存再读取,若读取速度小于接受速度
    
    窗口大小控制

    过大容易造成接收方缓存区数据溢出,丢弃后造成无意义重传。

    通过TCP首部的值进行动态大小控制。

    Q:为何需要发送窗口探测包?

    A:接收方缓存区即将满后会暂停接收并通知发送方暂停发送(窗口大小为0)。接收方可以重新开始接受时发送一个窗口更新包通知。避免此包丢失导致通信无法重新开始,发送端时不时发送窗口探测包来获取最新的窗口大小信息。

    拥塞控制

    连接建立初期,突然发送大量数据容易造成网络瘫痪。

    调节拥塞时发送大小的量,定义了“拥塞窗口”,让发送方窗口大小等于拥塞窗口。

    设计思想:无拥塞则调大拥塞窗口,拥塞时马上减小窗口

    慢启动算法:

    1. 将拥塞窗口设置为1个MSS(Maximum Segment Size,最大数据段)
    2. 开始窗口指数增长到慢启动阀值(第一次无限制)
    3. 到达慢启动阀值后改为线性增长(除第一次)
    4. 一旦发生超时则将慢启动阀值设置成当时的拥塞窗口大小的一半,并重新步骤1
    5. 一旦发生重复确认应答则将慢启动阀值设置成当时拥塞窗口的一半,之后将拥塞窗口设置为慢启动阀值大小+3MSS,并重新步骤3

    应用层

    WWW基本概念

    WWW=信息手段和位置-URI(Uniform Resource Identifer)+信息表现形式-HTML(HyperText Markup Language)+ 信息转发-HTTP(HyperText Transfer Protocol)

    HTTP

    主要有八种方法,常用的是GET和POST

    Q:HTTP 1.0、1.1、2.0的不同之处?

    A:1.0每次请求和应答都会使用新的TCP连接,1.1允许使用一个TCP连接,大幅减少断开和建立,提升性能。

    2.0使用了多路复用、二进制分帧、首部压缩等技术进一步提升性能。详见链接

    Q:GET和POST的不同之处?

    A:设计的定义不同之处

    • GET是幂等的(不改变数据)也不改变服务器状态的,POST非幂等且可改变服务器状态
    • GET参数拼接在URL中,POST在HTTP请求头的Body中
    • GET参数长度受到url长度的限制(取决于浏览器和服务器限制而非本身)
    Cookie & Session

    HTTP 是一种无状态的连接,客户端每次读取时,服务器都会认为这是一次新的会话。有时候需要持久保持某些信息,这些信息就由 Cookie 和 Session 保存。

    Cookie 保存在客户端上,而 Session 则保存在服务器中。

    当服务端接收到 Cookie 后,根据 SessionID 来查找。如果没有,则会生成一个新的 SessionID 发送给客户端。

    HTTPS

    HTTP协议在安全上存在三个风险:

    • 明文传输-数据被窃听
    • 不验证数据完整性-数据被篡改
    • 不验证身份-冒充发送者身份通信

    针对这三个风险,HTTPS分别做了处理:

    • 窃听-加密报文
    • 篡改-消息校验(Hash)
    • 伪装-证书校验(证书验证链)

    最后

    TCP/IP每层都设计得巧妙,实用。了解了TCP/IP之后,对网络问题的思考会更加透彻。

    相关文章

      网友评论

        本文标题:TCP/IP协议族边学边想

        本文链接:https://www.haomeiwen.com/subject/ifdkdxtx.html