美文网首页
EXCEL如何清洗混乱的字符串,拆分数据利器之“分列功能”全解析

EXCEL如何清洗混乱的字符串,拆分数据利器之“分列功能”全解析

作者: 陶泽昱 | 来源:发表于2018-07-10 21:12 被阅读0次

        “分列”功能非常强大,不仅可以根据“分隔符号”将目标拆分成 多个列,也可以根据字符个数对目标进行拆分,更神奇的是可以通过设置“列数据格式”来规范数据。

一、以“分隔符号”方式提取目标字段

如图1所示,A列数据包含3种信息,即“公司、药品和药品型号”,各信息之间以分号“;”分隔,目前希望从中提取公司和药品信息。具体操作步骤如下。

图1以【分隔符号】方式提取目标字段

步骤1选中要进行分列的数据列,如A列数据区域;

步骤在【数据】选项卡中单击【分列】命令,打开【文本分列向导-第1步,共3步】对话框,选择【分隔符号】选项,单击【下一步】按钮,如图2所示;

图2以【分隔符号】作为【分列】依据

步骤在【文本分列向导-第2步,共3步】对话框中勾选【分号】的复选框,单击【下一步】按钮;

步骤在【文本分列向导-第3步,共3步】对话框的【数据预览】区域中先单击选中第3列,然后选择【不导入此列(跳过)】选项,跳过 第3列数据;

步骤目标区域编辑栏中输入“=$B$1”,按【完成】按钮,关闭对话框,如图3所示。

图3设置具体的分列依据和分列后各列的属性

此时得到B列、C列数据,为其修改或添加字段名,比如设置B1单元格为“公司”,C1单元格为“药品”,设置相应的各省市,就得到图 1所示效果。

当再次单击B2单元格时,单元格下方会出现设置的提示信息,如图1所示。

二、以“固定宽度”方式拆分单元格

“分列”功能还提供了以“固定宽度”方式进行拆分的选项,即直接根据字符个数拆分单元格。如图4所示,需要从身份证号码中提取 “地区代码”和“出生日期”信息。下面介绍具体的操作步骤。

图4 从身份证号码中提取地区代码和出生日期

步骤选中目标单元格或目标列,如A2单元格,然后在【数据】选项卡中单击【分列】按钮,打开【文本分列导向-第1步,共3步】对话框;

步骤选中【固定宽度】选项,单击【下一步】按钮,打开【文本分列导向-第2步,共3步】对话框;

步骤在【数据预览】区域“标尺”下方相应位置单击建立“分列线”,比如分别在刻度6和14位置单击建立“分列线”,单击【下一步】按钮,打开【文本分列导向-第3步,共3步】对话框。

要建立“分列线”,可以在“数据预览”区域对应位置直接单击。要删除“分列线”,可以直接双击“分列线”。要移动分列线,可以按住“分列线”拖动至目标位置。

步骤将第3列“列数据格式”设置为“不导入此列(跳过)”,将第2列“列数据格式”设置为【日期】的“YMD”格式,表示年月日的格式来识别日期数据。

步骤在【目标区域】编辑框中输入“=$B$2”,单击【完成】按钮,如图5所示。

图5 从身份证号码中提取地区代码和出生日期

此时,B2单元格返回本地代码“330222”,C2单元格返回出生日期“1980-2-27”。如果需要处理的数据是一整列,就能体现出惊人的效率。

三、转换MDY格式的文本日期

“年月日”格式(即YMD格式)的日期数据是规范易识别的,但实际工作中也经常遇到“月日年”格式(即MDY)的日期格式。如果得到的数据类型是真正的日期,可以通过“单元格格式”功能直接转换,但如果得到的是两位年份的文本型日期数据,要想快速转换就不那么容易了。

图6转换MDY格式的文本日期

如图6所示,A2单元格数据为“04/01/09”,文本型日期,表示“2009年4月1日”,现在需要将其转换为真正的 日期“2009/4/1”。使用默认设置下的“分列”功能,可以成功将文本型日期转换为真正的日期,但日期被错误地识别为“2004/1/9”,如图7所示。

图7 处理后的日期不符合要求

此时,只需选择【列数据格式】为【日期】,并在【日期】下拉列表中选择“MDY”项目,保持【目标区域】编辑框默认设置,单击【完成】按钮,关闭对话框即可,如图8所示。

图8 设置日期识别格式

此时,文本型日期数据被正确识别,并以真正的日期数据类型返回到原数据区域。在【日期】下拉列表中有丰富的日期格式,用以应付各种不规范的文本型日期数据。

相关文章

网友评论

      本文标题:EXCEL如何清洗混乱的字符串,拆分数据利器之“分列功能”全解析

      本文链接:https://www.haomeiwen.com/subject/ekgqpftx.html