Python网络编程

作者: 爱秋刀鱼的猫 | 来源:发表于2017-12-01 15:34 被阅读27次

    其实这个问题一直困扰我。我算是一个目的驱动型的人。所以我觉得做一件事情,当你知道为什么要去做,那么你做这件事情的时候就不会迷茫。知道干这件事可以得到什么,那干这件事才会持久。那第一个问题就是:

    我们为什么要学习网络编程?🤔️

    因为我们现在所有的程序都是在网络中的。很少有单机版的程序了。
    计算机网络就是把各个计算机连接到一起,让网络中的计算机可以互相通信。网络编程就是如何在程序中实现两台计算机的通信。
    举个例子,当你使用浏览器访问新浪网时,你的计算机就和新浪的某台服务器通过互联网连接起来了,然后,新浪的服务器把网页内容作为数据通过互联网传输到你的电脑上。
    由于你的电脑上可能不止浏览器,还有QQ、Skype、Dropbox、邮件客户端等,不同的程序连接的别的计算机也会不同,所以,更确切地说,网络通信是两台计算机上的两个进程之间的通信。比如,浏览器进程和新浪服务器上的某个Web服务进程在通信,而QQ进程是和腾讯的某个服务器上的某个进程在通信。所以


    Socket

    在网络编程之前,要知道一个概念,叫socket(套接字)。Socket是一个“五元组”。这个五元组包括[(协议,本地IP地址,本地端口号,远程IP地址,远程端口号)]。Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。

    网络编程的类型:

    在传输层有两种协议:有连接的,可靠的,面向字节流的TCP和无连接的,不可靠的UDP。

    TCP编程

    大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动响应连接的叫服务器。

    客户端

    举个例子,当我们在浏览器中访问新浪时,我们自己的计算机就是客户端,浏览器会主动向新浪的服务器发起连接。如果一切顺利,新浪的服务器接受了我们的连接,一个TCP连接就建立起来的,后面的通信就是发送网页内容了。
    这个程序用作tcp的客户端:

    import socket
    
    • 创建一个socket
    s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    

    创建Socket时,AF_INET指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议,这样,一个Socket对象就创建成功,但是还没有建立连接。

    • 建立连接
      传入的参数是一个元组,客户端要主动发起TCP连接,必须知道服务器的IP地址和端口号
    s.connect(('www.sina.com.cn',80))
    

    建立好连接以后,我们就可以向新浪服务器

    • 发送请求
    #发送数据
    s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
    
    • 接收数据
    buffer = []
    while True:
        #每次最多接受1K字节
        d = s.recv(1024)
        if d:
            buffer.append(d)
        else:
            break
    data = b''.join(buffer)
    
    • 当数据接收完,调用close()
    #关闭连接
    s.close()
    

    接收到的数据包括HTTP头和网页本身,我们只需要把HTTP头和网页分离一下,把HTTP头打印出来,网页内容保存到文件:

    header, html = data.split(b'\r\n\r\n', 1)
    print(header.decode('utf-8'))
    # 把接收的数据写入文件:
    with open('sina.html', 'wb') as f:
        f.write(html)
    
    服务器

    和客户端编程相比,服务器编程就要复杂一些。服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了,服务器就与该客户端建立Socket连接,随后的通信就靠这个Socket连接了。我们可以把socket函数看作是一个文本类型,即可以对其进行读写操作。
    所以,服务器会打开固定端口(比如80)监听,每来一个客户端连接,就创建该Socket连接。由于服务器会有大量来自客户端的连接,所以,服务器要能够区分一个Socket连接是和哪个客户端绑定的。一个Socket依赖4项:服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。
    但是服务器还需要同时响应多个客户端的请求,所以,每个连接都需要一个新的进程或者新的线程来处理,否则,服务器一次就只能服务一个客户端了。
    我们来编写一个简单的服务器程序,它接收客户端连接,把客户端发过来的字符串加上Hello再发回去。
    首先,创建一个基于IPv4和TCP协议的Socket:

    import socket
    import time,threading
    #创建一个socket
    s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    

    然后我们绑定监听的地址和端口。

    s.bind(('127.0.0.1',9999))
    

    紧接着,调用listen()方法开始监听端口,传入的参数指定等待连接的最大数量:

    s.listen(5)
    print('Waiting for connection......')
    

    接下来,服务器程序通过一个永久循环来接受来自客户端的连接,accept()会等待并返回一个客户端的连接:

    while True:
        #接受一个新连接:
        print("Blocking....")
        sock,addr = s.accept()
        #创建新线程来处理TCP连接
        print(sock)
        t = threading.Thread(target=tcplink, args=(sock, addr))
        t.start()
    

    这里我们需要创建一个线程处理函数来处理事务:

    def tcplink(sock, addr):
        print('Accept new connection from %s:%s...' % addr)
        sock.send(b'Welcome!')
        time.sleep(10)
        while True:
            data = sock.recv(1024)
            time.sleep(1)
            if not data or data.decode('utf-8') == 'exit':
                break
            sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
        sock.close()
        print('Connection from %s:%s closed.' % addr)
    

    这里我们要重点注意accept()函数:
    accept函数返回一个二元组,sock是一个新的socket对象,用来接收和发送数据。addr表示另一端的socket地址。接下来我们就可以用sock对象发送和接收数据了。

    运行的结果: 屏幕快照
    现在我们可以再整理一下TCP编程的流程,我画了下面这个流程图:
    TCP编程流程图.JPG

    其实,这是网络编程最初级的阶段。接下来还有其他处理并发的方式。继续深入研究。

    相关文章

      网友评论

      本文标题:Python网络编程

      本文链接:https://www.haomeiwen.com/subject/qtkwbxtx.html