美文网首页
gene name error with excel

gene name error with excel

作者: 普鲁卡果 | 来源:发表于2017-12-04 21:04 被阅读0次

早在2004年,Zeeberg学者就发现Excel 打开含有gene name 的文件,会造成一些gene name 的改变:一些与月份相似的基因名会自动转化为月份。

2016年,《Gene name errors are widespread in the scientific literature》一文对于这个问题又进行了更详细深入的研究,除了月份的转变后,还发现一些编码会转变成浮点型格式,如from accession ‘2310009E13’ to ‘2.31E+13’。通过网络爬虫,对不同期刊的补充材料的文件进行按列查找错误,结果发现错误率达19.6%,且影响因子高的期刊反而错误率跟高,可能与数据量有关。近几年的这种错误并没有得到解决。

目前对于Excel打开文件造成的错误无法解决,研究者发现google sheet 可以不自动转换,保存后的文件即使再用excel打开后也不会转换。亲测有效。

虽然文章很简单,作者也没有提出更有效的解决方案,然而作者通过爬虫调取了大量文献,数据下载,清洗,总归是有可靠的研究成果哒,科研有漏洞,调查需谨慎!

相关文章

网友评论

      本文标题:gene name error with excel

      本文链接:https://www.haomeiwen.com/subject/bwkfixtx.html