美文网首页
日志读取各个模块的分别实现之读取(二)

日志读取各个模块的分别实现之读取(二)

作者: 学不会swoole不改名 | 来源:发表于2019-05-21 13:41 被阅读0次
    日志统计系统.png
    日志三个模块.png

    分别实现下面的三个模块(-)读取

        //----------第一步读取你的日志返回值点开看看就知道了-----------------------
        f, err := os.Open(r.Path)
        if err != nil {
            //--------没有读取到panic喽-------------
            panic(err)
        }
        //----------如果读取到了---------------
        rea := bufio.NewReader(f)
        //------循环读取,不然读取一行就over----------------
        for {
            //----------一行一行读取,这句话的意思是见到\n就是换行标识符,就会over 注意单引号,''byte (个人理解)---------------------
            body, err := rea.ReadBytes('\n')
            if err == io.EOF {
                //--------如果读取完了这个文件没有东西了,我们等待一下,continue---------------------
                time.Sleep(1 * time.Second)
                continue
            } else if err != nil {
                panic(err)
            }
            //-----------这句话的意思是去掉换行符,不然每次都有一个\n输出----------------
            rc <- string(body[:len(body)-1])
        }
    
    }
    
    

    读取完了,写入和解析只解析一次,最简单的写个for 或者range一下你的读取的chan 有东西再解析,写入(这里我就直接for了)

    //-----------使用者第二步写入日志----------------
    func (w *WriteLogs) Write(wc chan string) {
        for {
            fmt.Println(<-wc)
        }
    
    }
    
    //-----------使用者第三步解析日志----------------
    func (l *LogStatistics) Analysis() {
        for {
            l.wc <- strings.ToUpper(<-l.rc)
        }
    
    }
    

    解析就很简单了,将你从xx.log里面读取到的数据 通过正则匹配 传送给写入模块,我懒得写了,给个思路,下面贴上一段爬取boss的代码,这段代码里面 <-l.rc就是读取的文件数据

    可以讲将爬去的数据都写入到一个结构体,然后将结构体直接写入到l.wc,需要将你结构体的类型改成(比如结构体是msg chan 的类型就是*msg)原谅我的懒

    package parse
    
    import (
        "city/engine"
        "regexp"
    )
    
    const cityList = `<a ka=".+" href="(/.+/)">([^>]*)</a>`
    
    func ParseCityList(contents []byte) engine.ParseResult {
        re := regexp.MustCompile(cityList)
        match := re.FindAllSubmatch(contents, -1)
        request := engine.ParseResult{}
        for _, m := range match {
            request.Items = append(request.Items, string(m[2])) //job
            request.Requests = append(request.Requests, engine.Request{
                Url:       string(m[1]),     //url
                ParseFunc: engine.Nilparser, //
            })
            //fmt.Printf("job:%s ,URL:https://www.zhipin.com%s\n", m[2], m[1])
        }
        return request
    }
    

    相关文章

      网友评论

          本文标题:日志读取各个模块的分别实现之读取(二)

          本文链接:https://www.haomeiwen.com/subject/gtadzqtx.html