1、函数介绍
REGEXP_REPLACE(inputString, regexString, replacementString)
第一个参数:表中字段
第二个参数:正则表达式
第三个参数:要替换称为的字符
2、使用中的坑
函数使用起来比较简单,但是也有坑,当要匹配特殊的隐藏字符\n \r \t ,等回车符、制表符时,需要通过使用。
sparkSession.sql(
"""
|select
|regexp_replace(title, '\\\\n|\\\\\t|\\\\\r', ',') title
|from tableName
""".stripMargin)
3、解决的问题
如果不删除这些隐藏字符,在我们导出数据写入文件时会产生异常,会在数据中间进行换行
网友评论