网路I/O
1、I/O模型
“一切皆文件”,Linux内核会把所有外部设备看做一个文件来操作,在网络I/O中系统对一个Socket的读写也会有相应的描述符,称为Socket fd(Socket描述符)。整个I/O流程分为两个阶段:
- 等待Socket数据准备好。
-
将数据从内核拷贝到应用进程中。
在《UNIX网络编程》中将UNIX网络I/O模型分为一下五种。
2、数据处理
跟文件I/O一样,网络I/O也使用了中断,它同时使用了软中断和硬中断。
网络性能评估
1、延迟与带宽
- 延迟:数据从信息源发送到目的地所需的时间
-
带宽:逻辑或物理通讯路径最大的吞吐量
2、性能测试
- 吞吐量:网路接口接收和传输的每秒字节数
- 延迟:系统调用发送/接收延迟、连接延迟、首包延迟、网络往返时间等
- 连接数:每秒的连接数量
-
错误:丢包计数、超时等
常用分析工具
移动端优化
1、网络优化点
- 速度:在网络正常或良好的情况下,怎样更好的利用带宽,进一步提高网络请求速度
- 弱网络:移动端网络复杂多变,在网络连接出现不稳定时,怎样最大限度的保证网络的连接
-
安全:怎样有效的防止被第三方劫持、窃听甚至篡改
上图展示了一个网络请求的整个过程,针对相关步骤可相应的采取不同的应对方法。
- DNS解析:通过DNS服务器,拿到对用域名的IP地址
- 创建连接:跟服务器建立连接,包括TCP三次握手、TLS密钥协商等工作
- 发送/接收数据:在成功与服务器建立连接后,双方即可进行数据交互
- 关闭连接:分为主动关闭和被动关闭,一般我们希望客户端可以主动关闭连接
2、网络库
网路库的核心作用:
- 统一编程接口
- 全局网络控制
-
高性能
各大网路库性能对比
大网络平台
网络优化不仅仅是客户端的事情,需要前后端一整套解决方案。下图是蚂蚁的mPaaS的网络架构,所有的网络请求都会先经过统一的接入层,再转发到业务服务器。这样我们可以在业务服务器无感知的情况下,在接入层做各种各样的网路优化。
1、HTTPDNS
DNS解析是网路请求的第一项工作,默认我们会使用运营商的LocalDNS服务。它存在一些问题:
- 稳定性:UDP协议,无状态,容易域名劫持(难复现、难定位、难解决)
- 准确性:LocalDNS调度经常出现不准确
- 及时性:运营商可能修改DNS的TTL,导致DNS修改生效延迟
为了解决这些问题,简单来说就是自己做域名解析的工作,通过HTTP请求后台去拿到域名对应的IP地址。
2、连接复用
DNS解析之后,进入创建连接环节,创建连接需要经过TCP三次握手、TLS密钥协商,建立连接的代价是非常大的,连接复用,不用每次请求都重新建立连接。
网路库对连接的管理是将连接放到连接池中,而不是直接释放掉,当遇到相同的地址和端口请求时,就直接从连接池中取出连接直接发送和接收数据,减少建立连接的耗时。
实现方案则是利用HTTP协议中keep-alive,而HTTP/2.0的多路复用则可以进一步提升连接复用。它复用的这条连接支持同时处理多条请求,所有请求都可以并发在这条连接上进行。
使用HTTP/2需要解决两个问题,一是同一条连接只支持同一个域名,一个是后端支持HTTP/2需要额外的改造。这个时候我们只要在接入层做改造,接入层数据转换到HTTP/1.1再转发到对应域名的服务器。
3、压缩与加密
压缩
对于HTTP请求来说,数据主要包括三个部分:
- 请求URL
- 请求header
- 请求body
对于header来说,HTTP/2连接本身有头部压缩技术,因而需要压缩的主要是请求URL和请求body。
对于请求body来说,一方面是通讯协议的选择,另一方面则是压缩算法的选择。通讯协议流行的有JSON和Protocol Buffers。压缩算法主要有gzip,Google的Brotli和Facebook的Z-standard。
安全
HTTPS优化:
- 连接复用率
- 减握手次数
- 性能提升
4、其他优化
移动端监控
1、如何监控网络
方法一:插装
方法二:Native Hook
一般会hook网络相关的几个方法
- 连接相关:connect
- 发送数据相关:send和sendto
- 接收数据相关:recv和recvfrom
方法三:统一网络库
2、如何监控流量
一般通过TrafficStat类,TrafficStat是Android API8加入的接口,用与获取整个手机或者某个UID从开机算计的网络流量。TrafficStat的实现原理是读取proc,并将目标UID下面所有网络接口流量相加。除了流量信息,通过/proc/net我们还可以拿到大量网络相关的信息,如网络信号强度,电平强度等。
大网络平台监控
1、客户端监控
- 时延
- 维度,网络类型、国家、省份、城市、运营商、系统等等
- 错误,DNS失败、连接失败、超时、返回错误码等
2、接入层监控
监控原因:
- 实时性,客户端实时上报,对性能有影响,服务端则不会出现这个问题
- 可靠性,如果出现网络问题,客户端的数据上报可能受到影响,客户端数据不可靠
3、监控报警
- 实时监控
- 离线监控
业界存在两种报警算法,一是基于规则,例如失败率与历史数据相比暴涨、流量暴跌等;二是基于时间序列算法或者神经网络的智能报警。
网友评论