本人在“极客时间”上购买了一套“趣谈网络协议”的课程,本文为该课程第13讲(第13讲 套接字Socket)的课程笔记。
1.socket编程及参数
- Socket 编程基于 TCP 和 UDP 协议
- Socket 这个名字很有意思,可以作插口或者插槽讲。虽然我们是写软件程序,但是你可以想象为弄一根网线,一头插在客户端,一头插在服务端,然后进行通信。所以在通信之前,双方都要建立一个 Socket。
- Socket 编程进行的是端到端的通信,能够设置的参数,也只能是端到端协议之上网络层和传输层的。
- 在网络层,Socket 函数需要指定到底是 IPv4 还是 IPv6,分别对应设置为 AF_INET 和 AF_INET6。另外,还要指定到底是 TCP 还是 UDP。还记得咱们前面讲过的,TCP 协议是基于数据流的,所以设置为 SOCK_STREAM,而 UDP 是基于数据报的,因而设置为 SOCK_DGRAM。
2.基于 TCP 协议的 Socket 程序函数调用过程
1)TCP 的服务端要先监听一个端口,一般是先调用 bind 函数,给这个 Socket 赋予一个 IP 地址和端口。
2)当服务端有了 IP 和端口号,就可以调用 listen 函数进行监听。这个时候客户端就可以发起连接了。
- 在内核中,为每个 Socket 维护两个队列。
- 一个是已经建立了连接的队列,这时候连接三次握手已经完毕,处于 established 状态;
- 一个是还没有完全建立连接的队列,这个时候三次握手还没完成,处于 syn_rcvd 的状态。
3)接下来,服务端调用 accept 函数,拿出一个已经完成的连接进行处理。如果还没有完成,就要等着。
- 在服务端等待的时候,客户端可以通过 connect 函数发起连接。先在参数中指明要连接的 IP 地址和端口号,然后开始发起三次握手。内核会给客户端分配一个临时的端口。一旦握手成功,服务端的 accept 就会返回另一个 Socket。
- 这是一个经常考的知识点,就是监听的 Socket 和真正用来传数据的 Socket 是两个。
- 一个叫作监听 Socket
- 一个叫作已连接 Socket。
4)连接建立成功之后,双方开始通过 read 和 write 函数来读写数据,就像往一个文件流里面写东西一样。
5)socket文件流
- TCP 的 Socket 就是一个文件流。
因为Socket 在 Linux 中就是以文件的形式存在的。除此之外,还存在文件描述符。写入和读出,也是通过文件描述符。 -
数据结构
3.基于 UDP 协议的 Socket 程序函数调用过程
- UDP 是没有连接的,所以不需要三次握手,也就不需要调用 listen 和 connect,
- 但是,UDP 的的交互仍然需要 IP 和端口号,因而也需要 bind。
- UDP 是没有维护连接状态的,因而不需要每对连接建立一组 Socket,而是只要有一个 Socket,就能够和多个客户端通信。
- 也正是因为没有连接状态,每次通信的时候,都调用 sendto 和 recvfrom,都可以传入 IP 地址和端口。
4.服务器如何接更多的项目
- 服务端最大并发TCP连接数理论值:
最大 TCP 连接数 = 客户端 IP 数×客户端端口数。对 IPv4,客户端的 IP 数最多为 2 的 32 次方,客户端的端口数最多为 2 的 16 次方,也就是服务端单机最大 TCP 连接数,约为 2 的 48 次方。 - 作为老板,在资源有限的情况下,要想接更多的项目,就需要降低每个项目消耗的资源数目。
1)将项目外包给其他公司(多进程方式)
2)将项目转包给独立的项目组(多线程方式)
3)一个项目组支撑多个项目(IO 多路复用,一个线程维护多个 Socket)
4)一个项目组支撑多个项目(IO 多路复用,从“派人盯着”到“有事通知”)
- epoll (能做事件通知的函数)被称为解决 C10K 问题的利器。
- C10K,它的意思是一台机器要维护 1 万个连接,就要创建 1 万个进程或者线程,那么操作系统是无法承受的。
网友评论