我们在数据采集阶段获取的数据集,经常会遇到某些字段存在缺失值。比如,下面的会员信息表中,性别字段缺失,并且部分记录的会员所属店铺信息为空。

本节,小鱼将完成上述缺失字段的填充~ 一起来围观吧!
1. 批量录入空单元格
首先,我们将会员所属店铺字段中的缺失值全部填充为相同的内容。选中 G1
单元格,拖动滚动条至表格的最后,按住 Shift
键的同时,点击 G459
单元格,这样 G
列中的数据就全部被我们选中了。

按 Ctrl+G
调出【定位】对话框,点击【定位条件】按钮:

在弹出的【定位条件】对话框中,选择【空值】作为定位条件,点击确定:

此时,G
列中的所有空值就被我们全部选中啦~ 注意,这个时候鼠标不要乱点,否则我们好不容易选中的单元格就会功亏一篑!
来到公式输入框,录入填充内容,我们可以看到此时 G
列中第一个空单元格已经被填充了录入的内容,但其他单元格还是空的:

不要着急,只需一个动作即可完成!按下 Ctrl+Enter
快捷键,即可实现同步录入:

总结一下,批量录入空单元格共分如下 3 个步骤:选中需要填充的列,按 Ctrl+G
定位,定位条件为空值;在公式栏输入需要填充的内容;按 Ctrl+Enter
同步录入。
接下来,我们来完成性别字段的填充。
2. 从身份证提取性别信息
其实,性别隐藏在我们的身份证号码中。身份证包含很多个人信息,其中倒数第二位就是性别信息。倒数第二位数字为奇数,则为男性;倒数第二位如果是偶数,则为女性。
既然通过倒数第二位数字进行判断,我们首先来提取身份证中的倒数第二个数字。在 E2
单元格录入公式 =MID(D2, 17, 1)
,表示从 D2
单元格的第 17
位开始,提取 1
位数据。

Excel 中的文本提取函数
LEFT(文本, 字符个数)
从文本左侧提取字符;
MID(文本, 从第几个字符开始, 提取几个字符)
从文本中间指定位置提取字符;
RIGHT(文本, 字符个数)
从文本右侧提取字符。
点击 E2
单元格右下角进行自动填充,可以观察一下提取的文本是否符合预期。

按照思路,接下来,我们需要进一步判断提取到的数字是奇数,还是偶数。在 E2
单元格录入嵌套函数 =ISEVEN(MID(D2,17,1))
以判断 MID(D2,17,1)
是否为偶数。

Excel 中的奇偶判断函数
ISODD(数字)
判断是否是奇数;
ISEVEN(数字)
判断是否是偶数。
完成剩余单元格的自动填充,我们发现偶数返回 True
,奇数返回 False
。

接下来,就需要 Excel 中的条件判断函数登场啦~
IF 函数
IF(条件判断式, 真值, 假值)
条件判断式成立,IF
函数返回真值,否则返回后面的假值。
在 E2
单元格录入嵌套函数 =IF(ISEVEN(MID(D2,17,1)), "女", "男")
,当 MID(D2,17,1)
为偶数时,返回 女,否则返回 男:

至此,数据集中的缺失值就全部完成填充啦~

总结
当数据集中存在缺失字段时,我们往往需要对其进行填充。对于需要填充相同内容的大量空白单元格,我们通常采取【定位空单元格+输入内容+同步录入】的方法批量录入。
如果是从已有字段中获取信息,通常使用相应的函数获取。比如身份证中获取性别,可以使用【MID+ISODD+IF】或者【MID+ISEVEV+IF】获取。
网友评论