据英国《卫报》报道,英国公共卫生部10月5日承认,由于“技术故障”,他们在统计中遗漏了9月25日以来的接近1.6万例新冠肺炎确诊病例。
而导致这一事故的原因却让人大跌眼镜,居然是由于卫生部门在使用Excel表格统计病例数据时,数据量超出了Excel的行数上限所导致的(1,048,576行)。这意味着随着检测数量超过100万,卫生部门的数据迟早会出问题。
Excel作为一款数据处理工具,有着直观的操作界面、出色的计算功能以及便捷的图表工具,是我们在日常工作与生活中使用频率最高的软件之一。
但就像英国卫生部的这次槽点满满的失误一样,Excel在使用过程中也存在着很多容易造成数据丢失的大坑,如果一不小心掉进去,轻则重做,重则...参加英国卫生部...
因此,在今天借着这个事件,我想跟大家聊一聊Excel常见的坑都有哪些,以及如何避免。
1. 储存数据量的限制
这次的统计遗漏事件为广大吃瓜群众普及了Excel数据储存的最大行数限制。但需要注意的是不同版本的Excel储存数据限制也是不同的。
97-2003版本的Excel行数上限仅为65,536(2的16次方),列数上限为256(2的8次方)
2007以上版本的Excel行数上限升级为1,048,576(2的20次方),列数上限为16,384(2的14次方)
幸亏英国用的Excel版本还不算太老,否则到今天他们的确诊人数最多只会到6万人了...
因此大家在用Excel进行数据处理时,一定要注意储存数据量不要超过储存的上限。一旦数据超限就直接说再见了,而且没有找回的可能。
如果必须处理百万级的数据,还请大家转投SQL、Access这些数据库软件的怀抱。(PS:十万量级以上的数据就可以考虑数据库了,Excel在除了10万以上的数据时就会疯狂吃内存,运行一个函数可能需要几分钟。因此不建议在有较大数据量级需要处理的情况下使用Excel)
同时必须提醒大家的是,在日常工作中Excel数据超限丢失的原因可不只是超过104万行,更多时候7、8万行的数据也会因超限丢失。
这是因为很多人在保存表格时并不会注意Excel的储存形式,有可能在对方发来的【.xls】(03及以前版本的格式)文件基础上编辑后,直接进行了保存,导致数据储存上限直接缩水为65536行。
因此,如果你的需要处理的数据量大于6万条,请务必注意保存的Excel文件格式是是【.xlsx】(07及以上版本的格式)。
2. 万恶的csv格式
接着刚刚数据丢失的问题,让我们再来看一下另一个可能导致数据丢失的常见原因:万恶的csv格式。
作为被【csv】格式坑过多次的人,我必须要在这篇文章中为大家敲响一个警钟!
相对于xlsx格式,CSV(逗号分隔值,Comma-Separated Values)文件以纯文本形式存储表格数据,更适合适应计算机批量处理的要求。因此,很多从网上以及公司内部数据平台下载的文件都会默认为是csv格式,下载后的文件也可以被Excel直接打开和处理,在处理过程中和一般的【.xlsx】文件没有什么不同。
但是,由于csv是以纯文本形式储存的,因此在csv格式的文件中所进行的所有格式调整、函数设置甚至新建的工作表都无法在csv格式文件中进行保存,自动保存也无法挽救!!!
血泪史啊!!!某年某月某日,我辛苦做了半天的表格,由于是csv格式且在保存时未更改格式,直接付之东流,且没有一丝丝找回的的可能...
因此强烈建议大家,下载后的数据文件如果是csv格式,请务必另存为xlsx(Excel 工作簿)再进行编辑。
3. 数据未及时保存
这个坑相信就不用我过多解释了吧,死机、断电、意外关闭...多少人心中的痛!
我们就直接来聊一下面对这个问题的解决方案吧:自动保存设置
不说废话了,直接上图!
在自动保存的设置中,大家需要注意两点内容:
保存自动恢复信息时间间隔,可以设置为最短1分钟
勾选【如果我没保存就关闭,请保留上次自动恢复的版本】
勾选【编辑逗号分隔(*.csv)时显示数据丢失警告】
这样就能避免大多数情况下,数据未保存的问题了,同时也能在一定程度上规避【问题2】的发生。
今天的分享就到这里,后期预计会单独开辟一个【Excel技巧】的话题,希望大家多多关注!
网友评论