美文网首页
golang的bufio源码分析

golang的bufio源码分析

作者: 云上听风 | 来源:发表于2018-05-02 19:50 被阅读0次

    原本只想用用bufio,但是网上文章没有一个写清楚bufio到底怎么用,每个方法具体干了什么,搞不明白原理就不敢乱用,还好有源码,自己来分析最清楚。

    Reader分析


    func NewReaderSize(rd io.Reader, size int) *Reader {
        // Is it already a Reader?
        b, ok := rd.(*Reader)
        if ok && len(b.buf) >= size {
            return b
        }
        if size < minReadBufferSize { //minReadBufferSize==16
            size = minReadBufferSize
        }
        r := new(Reader)
        r.reset(make([]byte, size), rd)
        return r
    }
    
    // NewReader returns a new Reader whose buffer has the default size.
    func NewReader(rd io.Reader) *Reader {
        return NewReaderSize(rd, defaultBufSize)
    }
    

    一开始传入io.Reader创建bufio.Reader,默认defaultBufSize为4096字节也就是4K字节。


    // fill reads a new chunk into the buffer.
    func (b *Reader) fill() {
        // Slide existing data to beginning.
        if b.r > 0 { //把buf剩余可读的数据复制到最前
            copy(b.buf, b.buf[b.r:b.w])
            b.w -= b.r
            b.r = 0
        }
    
        if b.w >= len(b.buf) {//缓存已经溢出了
            panic("bufio: tried to fill full buffer")
        }
        //maxConsecutiveEmptyReads == 100
        // Read new data: try a limited number of times.
        for i := maxConsecutiveEmptyReads; i > 0; i-- {
            n, err := b.rd.Read(b.buf[b.w:]) //从io中读取数据写入缓存 
            if n < 0 {
                panic(errNegativeRead)
            }
            b.w += n //更新写入缓存的长度
            if err != nil {
                b.err = err
                return
            }
            if n > 0 {
                return
            }
                  // n== 0时会循环尝试从io中读取,最多100次
        }
        b.err = io.ErrNoProgress //读了100次,n都为0
    }
    

    fill()把剩余未读长度的数据复制到缓存头部并且r重置为0,相当于把未读数据移动到头部。同时尽量从io中读取数据写入缓存,有可能不能写满。


    // ReadByte reads and returns a single byte.
    // If no byte is available, returns an error.
    func (b *Reader) ReadByte() (byte, error) {
        b.lastRuneSize = -1
        for b.r == b.w { //缓存中无数据可读
            if b.err != nil {
                return 0, b.readErr()
            }
            b.fill() // buffer is empty,从io中fill数据
        }
        c := b.buf[b.r]//此时肯定有数据了,取r位置的一个字节
        b.r++ //r游标移动一个字节
        b.lastByte = int(c)
        return c, nil
    }
    

    ReadByte()从缓存中读取一个字节,如果缓存中没有数据则尝试从io中填充数据。最后返回读取到的一个字节的内容


    
    // Read reads data into p.
    // It returns the number of bytes read into p.
    // The bytes are taken from at most one Read on the underlying Reader,
    // hence n may be less than len(p).
    // At EOF, the count will be zero and err will be io.EOF.
    func (b *Reader) Read(p []byte) (n int, err error) {
        n = len(p)
        if n == 0 {
            return 0, b.readErr()
        }
        if b.r == b.w {//缓存中无数据可读
            if b.err != nil {
                return 0, b.readErr()
            }
            if len(p) >= len(b.buf) { //p的空间大于等于缓存
                // Large read, empty buffer.
                // Read directly into p to avoid copy.
                n, b.err = b.rd.Read(p)//直接从io中把数据读取到p中
                if n < 0 {
                    panic(errNegativeRead)
                }
                if n > 0 {
                    b.lastByte = int(p[n-1])
                    b.lastRuneSize = -1
                }
                return n, b.readErr()
            }
            // One read.
            // Do not use b.fill, which will loop.
            // 无数据可读,表示buf中数据无用了则重置r和w的游标
            b.r = 0
            b.w = 0
            n, b.err = b.rd.Read(b.buf)//从io中读取到缓存
            if n < 0 {
                panic(errNegativeRead)
            }
            if n == 0 {
                return 0, b.readErr()
            }
            b.w += n//缓存写入了多少数据
        }
    
        // copy as much as we can
        n = copy(p, b.buf[b.r:b.w])//缓存中数据可读数据读取到p
        b.r += n //读了多少
        b.lastByte = int(b.buf[b.r-1])
        b.lastRuneSize = -1
        return n, nil
    }
    

    Read(p []byte):
    当缓存中没有可读数据时有两种情况:
    情况1. 当p的空间大于等于缓存时,直接从io中把数据读取到p。
    情况2. 当p的空间小于缓存时,重置缓存游标,尽量从io中读取数据到缓存 ,然后再从缓存中复制到p里。

    当缓存中有可读数据时,直接从缓存中把可读数据复制到p中,此时不会去读取io。

    p的空间有可能被填满,也有可能不满,返回的n说明读取了多少个字节。


    // Peek returns the next n bytes without advancing the reader. The bytes stop
    // being valid at the next read call. If Peek returns fewer than n bytes, it
    // also returns an error explaining why the read is short. The error is
    // ErrBufferFull if n is larger than b's buffer size.
    func (b *Reader) Peek(n int) ([]byte, error) {
        if n < 0 {
            return nil, ErrNegativeCount
        }
    
        //剩余可读小于n而且小于缓存时从io里fill数据到缓存
        for b.w-b.r < n && b.w-b.r < len(b.buf) && b.err == nil {
            b.fill() // b.w-b.r < len(b.buf) => buffer is not full
        }
        //n比缓存大,返回可读的缓存切片,而且错误值为ErrBufferFull
        if n > len(b.buf) {
            return b.buf[b.r:b.w], ErrBufferFull
        }
    
        // 0 <= n <= len(b.buf)
        var err error
        if avail := b.w - b.r; avail < n {
            // not enough data in buffer
            //缓存的可读数据不够读,返回可以读的缓存切片及错误值ErrBufferFull
            n = avail
            err = b.readErr()
            if err == nil {
                err = ErrBufferFull
            }
        }
        //如果缓存的可读数据足够就返回可读缓存切片和空错误
        return b.buf[b.r : b.r+n], err
    }
    

    Peek(n int):
    先从io中填充缓存。
    如果要读的n比缓存大返回错误值ErrBufferFull。
    如果n小于等于缓存,且可读数据不够读返回ErrBufferFull或者io读错误。
    如果有可够读的数据返回的错误为空。

    不管怎样都会返回缓存可读取的切片但是没有移动读游标,修改返回的切片会影响缓存中的数据。


    // Buffered returns the number of bytes that can be read from the current buffer.
    func (b *Reader) Buffered() int { return b.w - b.r }//可读长度
    
    // Discard skips the next n bytes, returning the number of bytes discarded.
    //
    // If Discard skips fewer than n bytes, it also returns an error.
    // If 0 <= n <= b.Buffered(), Discard is guaranteed to succeed without
    // reading from the underlying io.Reader.
    func (b *Reader) Discard(n int) (discarded int, err error) {
        if n < 0 {
            return 0, ErrNegativeCount
        }
        if n == 0 {
            return
        }
        remain := n
        for {
            skip := b.Buffered()
            if skip == 0 {//没可读先fill填充
                b.fill()
                skip = b.Buffered()
            }
            if skip > remain {
                skip = remain
            }
            b.r += skip //读游标直接跳过skip个字节
            remain -= skip
            if remain == 0 {//成功跳过请求的字节长度
                return n, nil
            }
            if b.err != nil {//出错了,返回剩下多少个字节没跳过和错误
                return n - remain, b.readErr()
            }
        }
    }
    
    

    Discard(n int) :
    跳过n个字节不读取,一直循环到成功跳过或者出现错误。

    Reader的其他方法我一般不用,所以也不分析了。

    总结:

    Peek返回错误不为空时,一种情况是你Peek的长度比缓存都大,那么数据永远不够,所以传入参数时要注意别比缓存大。
    别一种情况是,从io里尝试读数据了但还是准备不够你需要的长度,比如网络tcp的数据一开始没有到达,等下一轮你再调用Peek时可能缓存就足够你读了。
    其实就算有错误也会返回你可读取的切片。
    如果错误为空,恭喜你,数据都准备好啦。
    Peek不会移动读游标,如果直接使用Peek返回的切片可以配合Discard来跳过指定字节的数据不再读取也就是移动读游标。

    Read尽量先从缓存中读取数据。当前缓存无数据可读时先从io中读取填充到缓存里,然后从缓存中复制。返回读取到的数据长度不一定,小于或者等于Read要求的长度。

    想跳过n个字节不读取,使用Discard。

    使用NewReader初始化时默认缓存为4096字节,在某些情况下可能太大浪费内存或者太小不够用,最好还是使用NewReaderSize根据情况自定义缓存大小。


    Writer


    有空再写

    相关文章

      网友评论

          本文标题:golang的bufio源码分析

          本文链接:https://www.haomeiwen.com/subject/gqmcrftx.html