美文网首页
clickhouse 导出CSV时遇到双引号的问题

clickhouse 导出CSV时遇到双引号的问题

作者: helloGlobal | 来源:发表于2019-05-11 16:04 被阅读0次

背景:从clickhouse中导出CSV文件,然后将此文件保存到另一个表中,发现保存的内容包含双引号  “XXXX”

导致匹配不上

查clickhose 文档,在生成CSV时,字符串中的双引号会以两个双引号输出,除此之外没有其他规则来做字符转义了

而代码解析CSV时,没有使用 golang 自带的CSV包,而是自己解析的

r := bytes.NewReader(fileStream)

bufioreader := bufio.NewReader(r)

isFirstLine :=true

line,err := bufioreader.ReadBytes('\n')

iferr != nil || io.EOF == err {

break

}

line = bytes.TrimRight(line,"\r\n")

ifisFirstLine {

line = bytes.TrimPrefix(line,[]byte("\xef\xbb\xbf"))

}

columns := bytes.Split(line,[]byte{','})

这样就没有兼容到 双引号的情况

查看源码  encoding\csv\reader.go,发现其兼容了字符串含有双引号和不含双引号的情况

func(r *Reader)readRecord(dst []string) ([]string,error)

暂时解决方案:

clickhouse-client --query=" select member from test format CSV"  sed 's/"//g'> test.csv

参考文档:https://clickhouse.yandex/docs/zh/interfaces/formats/#csv

相关文章

网友评论

      本文标题:clickhouse 导出CSV时遇到双引号的问题

      本文链接:https://www.haomeiwen.com/subject/irgxaqtx.html