2020.06.27
Pandas中DataFrame里面的数字经常被显示成科学计数法格式,看起来非常不舒服,但是怎么才能让它们显示成正常格式呢?
image科学计数法
科学计数法就是把一个数字表示成X乘以10的n次方的形式,中间用E+
或E-
链接,也可以用小写的e+
或e-
,减号表示10的负n次方。比如下面的情况:
- 1.2E+4,表示1.2*10000即12000;
- 1.2E-4,表示1.2*0.0001即0.00012;
需要提前说明的是,在Python里面,所有的科学计数法表示的数字都是小数float类型,就是说type(1.2E+4)
输出的是float
。
如果我们想把科学计数法表示的数字变为整数,可以参考下面的代码。
image注意这里这里直接舍弃了小数部分。
默认显示
我们用下面的代码让Pandas的小数显示恢复成默认情况。
import pandas as pd
pd.reset_option('display.float_format')
然后我们进行测试会发现这时候存在很多问题,如下所示。
image第2个和第3个代码块都只保留了6位小数,后面的数位四舍五入了。
改进版本
我们修改显示格式参数,尝试手工将小数转为字符串,代码如下所示。
pd.options.display.float_format = '{:.10f}'.format
这样之后的效果如下图所示。
image我们看到精度没有损失,但都使用了10位小数,看山去更加怪异了。
深入改进
我们需要设计更加复杂的格式化函数,能够根据xxxE-zz
和xxxE+zz
进行自动选择小数部分的精度,代码如下所示。
import re
def pdFloatFormat(x):
li1=re.split('E+', str(x),flags=re.IGNORECASE)
li2=re.split('E-', str(x),flags=re.IGNORECASE)
if len(li1)>1 or len(li2)>1:
if len(li1)>1:
n1=len(li1[0].replace('.',''))-1
n2=int(li1[1])
nx=n2-n1
n=0 if nx>0 else nx
else:
n1=len(li2[0].replace('.',''))-1
n2=int(li2[1])
n=n1+n2
print(x,n)
x2=('{:.'+str(n)+'f}').format(x)
else:
x2=str(x)
return x2
pd.options.display.float_format=pdFloatFormat
这次再测试的结果如下图所示,看山去非常合适。
image附加内容
对于Numpy,为了避免科学计数法出现,建议添加下面几行代码。
import numpy as np
np.set_printoptions(formatter={'all': lambda x: str(x)})
np.set_printoptions(suppress=True)
注意这里后两行的顺序不能颠倒。
完整代码文件请进入本文所在项目地址的src文件夹下载。
欢迎访问我的个人站点,获取最新文章和更多资源
image
网友评论