cleansing data
当从其他人处得到一份excel原始数据时,往往会存在一些问题,需要我们做一些处理,才能方便调用数据。常见问题如下:
-
1.原始数据存在不能打印的字符,如何去除不能打印的字符
clean(text)功能:消除单元格中不能打印的字符,返回可打印的文本。如下图:
image.png -
2.将一个单元格中包含的信息分列显示(一般各信息间通过固定宽或者分隔符号分开)如下图
image.png
名字、姓氏、邮箱、职位四个信息在一个单元格内,并通过下划线分开,怎样将这四个信息分成四列显示?
第一步:点数据下的分列选项,出现如下窗口:
image.png
本例中通过分隔符号“_”分开,故选分隔符号,点下一步
image.png
本例中通过下划线分开,故选其他,并在后面空白处输入"_"(如果事先就选好了需要操作的区域,下方会显示预览),点下一步
image.png
左上方可以选择列表中数据的格式,目标区域选择需要操作的区域
,本例中是=$B$41:$B$46,点完成,结果显示如下:
image.png
-
3.Trim function
TRIM(text)去除文本中多余的空格,仅留下单词之间的空格,如下:
image.png -
4.substitute
例 image.png
=substitute(text,old_text,new_text,[instance_num])
=substitute(需要替换的文本,旧文本,新文本,第N个旧文本)
参数Instance_num ——为一数值,用来指定以 new_text (新文本)替换第几次出现的 old_text(旧文本)。注意第四个参数如果省略表示替换所有出现的旧文本。
参数Instance_num 可省略,这表示用 new_text(新文本)替换掉所有的old_text(旧文本)。
含有逗号和空格,公式和结果如下图
image.png
扩展replace函数
2.replace函数的语法格式
=Replace(old_text,start_num,num_chars,new_text)
=replace(要替换的字符串,开始位置,替换个数,新的文本)
注意:第四个参数是文本,要加上引号。
image.png
网友评论