算术和数据对齐

作者: 庵下桃花仙 | 来源:发表于2019-02-12 12:02 被阅读0次
In [20]: s1 = pd.Series([7.3, -2.5, 3.4, 1.5], index = ['a', 'c', 'd', 'e'])
In [22]: s2 = pd.Series([-2.1, 3.6, -1.5, 4, 3.1],
    ...:                index = ['a', 'c', 'e', 'f', 'g'])

In [23]: s1
Out[23]:
a    7.3
c   -2.5
d    3.4
e    1.5
dtype: float64

In [24]: s2
Out[24]:
a   -2.1
c    3.6
e   -1.5
f    4.0
g    3.1
dtype: float64

In [25]: s1 + s2
Out[25]:
a    5.2
c    1.1
d    NaN
e    0.0
f    NaN
g    NaN
dtype: float64

没有交叉值时为 NaN

In [27]: df1 = pd.DataFrame(np.arange(9.).reshape((3, 3)), columns=list('bcd'),
    ...:                   index=['Ohio', 'Texas', 'Colorado'])

In [28]: df2 = pd.DataFrame(np.arange(12.).reshape((4, 3)), columns=list('bde'),
    ...:                   index=['Utah', 'Ohio', 'Texas', 'Oregon'])

In [29]:

In [29]: df1
Out[29]:
            b    c    d
Ohio      0.0  1.0  2.0
Texas     3.0  4.0  5.0
Colorado  6.0  7.0  8.0

In [30]: df2
Out[30]:
          b     d     e
Utah    0.0   1.0   2.0
Ohio    3.0   4.0   5.0
Texas   6.0   7.0   8.0
Oregon  9.0  10.0  11.0

In [31]: df1 + df2
Out[31]:
            b   c     d   e
Colorado  NaN NaN   NaN NaN
Ohio      3.0 NaN   6.0 NaN
Oregon    NaN NaN   NaN NaN
Texas     9.0 NaN  12.0 NaN
Utah      NaN NaN   NaN NaN

使用填充值的算术方法

In [33]: df1 = pd.DataFrame(np.arange(12.).reshape((3, 4)),
    ...:                    columns=list('adcd'))

In [34]: df2 = pd.DataFrame(np.arange(20.).reshape((4, 5)),
    ...:                    columns=list('abcde'))

In [35]: df1 + df2
Out[35]:
      a   b     c     d     d   e
0   0.0 NaN   4.0   4.0   6.0 NaN
1   9.0 NaN  13.0  13.0  15.0 NaN
2  18.0 NaN  22.0  22.0  24.0 NaN
3   NaN NaN   NaN   NaN   NaN NaN
In [37]: df1.add(df2, fill_value=0)
Out[37]:
      a     b     c     d     d     e
0   0.0   1.0   4.0   4.0   6.0   4.0
1   9.0   6.0  13.0  13.0  15.0   9.0
2  18.0  11.0  22.0  22.0  24.0  14.0
3  15.0  16.0  17.0  18.0  18.0  19.0

灵活算术方法

方法 描述
add, radd 加法
sub, rsub 减法
div, rdiv 除法
floordiv, rfloordiv 整除
mul, rmul 乘法
pow, rpow 幂次方

DataFrame 和 Series 间的操作

In [38]: arr = np.arange(12.).reshape((3, 4))

In [39]: arr
Out[39]:
array([[ 0.,  1.,  2.,  3.],
       [ 4.,  5.,  6.,  7.],
       [ 8.,  9., 10., 11.]])

In [40]: arr[0]
Out[40]: array([0., 1., 2., 3.])

In [41]: arr - arr[0]
Out[41]:
array([[0., 0., 0., 0.],
       [4., 4., 4., 4.],
       [8., 8., 8., 8.]])

广播机制

frame = pd.DataFrame(np.arange(12.).reshape((4, 3)),
    ...:                      columns=list('bde'),
    ...:                      index=['Utah', 'Ohio', 'Texas', 'Oregon'])
In [44]: series = frame.iloc[0]

In [45]: series
Out[45]:
b    0.0
d    1.0
e    2.0
Name: Utah, dtype: float64

In [46]: frame  - series
Out[46]:
          b    d    e
Utah    0.0  0.0  0.0
Ohio    3.0  3.0  3.0
Texas   6.0  6.0  6.0
Oregon  9.0  9.0  9.0
In [47]: series2 = pd.Series(range(3), index=['b', 'e', 'f'])

In [48]: series2
Out[48]:
b    0
e    1
f    2
dtype: int64

In [49]: frame + series2
Out[49]:
          b   d     e   f
Utah    0.0 NaN   3.0 NaN
Ohio    3.0 NaN   6.0 NaN
Texas   6.0 NaN   9.0 NaN
Oregon  9.0 NaN  12.0 NaN

在列上广播,行上匹配

In [50]: series3 = frame['d']

In [51]: frame
Out[51]:
          b     d     e
Utah    0.0   1.0   2.0
Ohio    3.0   4.0   5.0
Texas   6.0   7.0   8.0
Oregon  9.0  10.0  11.0

In [52]: series3
Out[52]:
Utah       1.0
Ohio       4.0
Texas      7.0
Oregon    10.0
Name: d, dtype: float64

In [53]: frame.sub(series3, axis='index')
Out[53]:
          b    d    e
Utah   -1.0  0.0  1.0
Ohio   -1.0  0.0  1.0
Texas  -1.0  0.0  1.0
Oregon -1.0  0.0  1.0

axis 用于匹配的轴 axis='index' 或 axis=0

相关文章

  • 算术和数据对齐

    没有交叉值时为 NaN 使用填充值的算术方法 灵活算术方法 DataFrame 和 Series 间的操作 广播机...

  • 116、pandas基本功能2

    3、索引、选取和过滤 4、算术运算和数据对齐 由上面可以看到,自动的数据对齐操作在不重叠的索引处引入NA值。 从上...

  • pandas数据分析库3~4

    8.3算术运算和对齐 目的:通过学习算术运算和对齐来掌握nan缺失值处理、DataFrame与Series的运算与...

  • Pandas(算术运算和数据对齐)

    可以对不同索引的对象进行算术运算 对于DataFrame,对齐操作会同时发生在行和列上 在算术方法中填充值 当一个...

  • pandas学习 (二) Series和DataFrame操作

    数据运算与算术对齐 add() 加法,相当于(+) sub() 减法,相当于(-) div() 除法,相当于(/)...

  • Pandas入门2

    标题中的英文首字母大写比较规范,但在python实际使用中均为小写。 5.Pandas的数据运算和算术对齐 5.1...

  • pandas库学习(七) 算术和数据对齐

    pandas在具有不同索引的对象间进行算术运算时,如果有任何的索引对不相同的话,在结果中将会把各自的索引联合起来,...

  • iOS 结构体内存对齐浅析

    什么是内存对齐 内存对齐是一种在计算机内存中排列数据、访问数据的一种方式。它包含基本数据对齐和结构体数据对齐 。 ...

  • 数据存储

    整数和浮点数在内存里面的存储方式: 1.小端模式和大端模式 数据字的对齐 :按边界对齐和不按边界对齐 : 模2的...

  • 第二章 变量和基本类型

    2.1基本内置类型 C++定义了一套包括算术类型和空类型在内的基本数据类型。 2.1.1 算术类型 算术类型分为两...

网友评论

    本文标题:算术和数据对齐

    本文链接:https://www.haomeiwen.com/subject/gwbheqtx.html