美文网首页解密大数据
怎样对 Series 数据进行元素级别操作 - Daily Py

怎样对 Series 数据进行元素级别操作 - Daily Py

作者: 张利东 | 来源:发表于2017-08-13 22:41 被阅读36次

首发于微信公众号东哥夜谈。欢迎关注东哥夜谈,让我们一起聊聊个人成长、投资、编程、电影、运动等话题。
本帐号所有文章均为原创。文章可以随意转载,但请务必注明作者。如果觉得文章有用,欢迎转发朋友圈分享。


1. 缘起

pandas 讲究整体操作,想对里面的一些数据进行一些批量操作的时候,挨个用纯 Python 的方法,挨个遍历。这样简单是足够简单,但很不 pandasic。那有没有更为简单一些的办法呢?

2. 操作

Series 有个 map 方法,就是把函数映射到里面每个单元上,对单元进行操作。比如昨天我们说过的用astype修改元素类型,用 map 也可以实现。

In [3]: df = pd.DataFrame(np.random.randn(4,3), columns=list('bde'), index=['Utah','Ohio','Texas','Oregon'])

In [4]: df
Out[4]:
               b         d         e
Utah    0.241315 -0.586773 -1.365804
Ohio    0.973860 -0.600773  0.437951
Texas   1.003621 -1.142369 -1.374085
Oregon -0.290861  0.728503 -1.356081

In [34]: b = df.b

In [35]: b
Out[35]:
Utah      0.241315
Ohio      0.973860
Texas     1.003621
Oregon   -0.290861
Name: b, dtype: float64

创建了一个 Series,其 dtype 类型为 float。想要把它变成 float,可以 map 之。

In [36]: bs = b.map(str)

In [37]: bs
Out[37]:
Utah       0.2413152528188941
Ohio       0.9738595889440395
Texas      1.0036207238625463
Oregon    -0.2908605268647543
Name: b, dtype: object

想再换成 float,可以继续 map 之。

In [7]: bf
Out[7]:
Utah      0.483243
Ohio     -0.778462
Texas     1.581152
Oregon   -0.109222
Name: b, dtype: float64

多次转换,变的是形式,不变的内心

In [8]: bf == b
Out[8]:
Utah      True
Ohio      True
Texas     True
Oregon    True
Name: b, dtype: bool

这样换来换去意义不大,但 map 将函数映射到 Series 里面的元素这个功能,还是蛮好使的。比如做工程研究,节点位移精确到小数点后两位就足够足够了,怎么样一次性把所有结果都变成小数点后两位呢?

In [10]: bl = b.map(lambda x: '%.2f' % x)

In [11]: bl
Out[11]:
Utah       0.48
Ohio      -0.78
Texas      1.58
Oregon    -0.11
Name: b, dtype: object

Oh yeah,将数据 lambda 一下格式就可以了。不过这样结果就变成字符串了,虽然不影响显示,但可能影响后及分析,便可以进一步优化之。

In [12]: bl = b.map(lambda x: float('%.2f' % x))

In [13]: bl
Out[13]:
Utah      0.48
Ohio     -0.78
Texas     1.58
Oregon   -0.11
Name: b, dtype: float64

lambda 只能用于这种简单的情况,更复杂的操作可以干脆定义一个函数调用。话说我总觉得lambda有点多余,已经有功能更强大的函数了,为什么还要用它呢?仅仅是因为长得漂亮么?

3. 总结

今天我们讨论了如何对 Series 里面的元素进行批量操作,感觉一下子高大上了起来,不在总是不停的 loop 来纯 Python 了,吼吼!

一下子感觉对 pandas 的理解提升了一个档次有木有!


相关文章

  • 怎样对 Series 数据进行元素级别操作 - Daily Py

    首发于微信公众号东哥夜谈。欢迎关注东哥夜谈,让我们一起聊聊个人成长、投资、编程、电影、运动等话题。本帐号所有文章均...

  • Python之map与apply、applymap的区别

    map (其实是python自带的)用于series上,是元素级别的操作。 apply 用在dataframe上,...

  • 第三周pandas入门(数据特征)

    数据的排序: 注意:这里Series默认是0轴(纵向)元素的排序,所以dataFrame也是对0轴(纵向)元素进行...

  • Python在元素级别上对列表进行操作

    一、方法 采用列表推导式 采用map函数+lambda函数 二、应用 对列表数据进行最大/最小归一化或者是z-sc...

  • apply 函数族

    apply(对矩阵、数据框和数组进行行列的操作) lapply(作用于列表和数据框,对列表中的每个元素进行循环操作...

  • Scrapy爬取豆瓣电影

    1.在items.py中定义字段,这些字段用来保存数据,方便后续的操作 2.修改settings.py对项目进行配...

  • 工具 | Pandas 100 题

    创建 Series 数据类型 列表创建 ndarray 创建 字典创建 Series 基本操作 修改 Series...

  • Python数据分析_Pandas07_字符串数据

    str属性 官方docs str属性只对series。 可以用来对数据框的列名和文字列进行操作。 常用操作 分割 ...

  • collection(8)--sortBy

    对集合内的元素进行排序,依据每个元素进行某异步操作后产生的值,从小到大排序。 测试数据: 代码: 结果: 如果出错...

  • pandas和numpy中的遍历操作

    遍历操作 遍历操作分为两种: 按照指定轴进行操作 按照元素进行操作 数据类型 pandas中数据类型主要有Data...

网友评论

    本文标题:怎样对 Series 数据进行元素级别操作 - Daily Py

    本文链接:https://www.haomeiwen.com/subject/nbqyrxtx.html