美文网首页
Python Pandas 向DataFrame中添加一行/一列

Python Pandas 向DataFrame中添加一行/一列

作者: 王叽叽的小心情 | 来源:发表于2020-08-19 16:32 被阅读0次

    在Pandas的DataFrame中添加一行或者一列,添加行有df.loc[]以及df.append()这两种方法,添加列有df[]df.insert()两种方法, 下面对这几种方法的使用进行简单介绍。

    一、添加行
    1. 添加一行,采用loc[]方法
    # 构造一个空的dataframe
    import pandas as pd
    df = pd.DataFrame(columns=['name','number'])
    # 采用.loc的方法进行
    df.loc[0]=['cat', 3]  # 其中loc[]中需要加入的是插入地方dataframe的索引,默认是整数型
    # 也可采用诸如df.loc['a'] = ['123',30]的形式
    

    采用loc[]方法多适用于对空的dataframe循环遍历添加行,这样索引可以从0开始直到数据结果,不会存在索引冲突的问题。

    1. 添加一行或合并两个dataframe,采用append()方法
    # 1. 采用append方法合并两个dataframe
    # 构造两个dataframe
    df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
    df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))
    # 合并  ignore_index设置为 True可以重新排列索引
    df.append(df2, ignore_index=True)
       A  B
    0  1  2
    1  3  4
    2  5  6
    3  7  8
    
    # 2. 采用append方法添加多行
    df = pd.DataFrame(columns=['A'])
    for i in range(5):
        df = df.append({'A': i}, ignore_index=True)
    df
       A
    0  0
    1  1
    2  2
    3  3
    4  4
    # 同样如果是遍历添加多行,有一种更高效的方法
    pd.concat([pd.DataFrame([i], columns=['A']) for i in range(5)],
              ignore_index=True)
       A
    0  0
    1  1
    2  2
    3  3
    4  4
    
    二、添加列
    1. 新增一列,采用df[]方法直接在列上操作
    # 新建一个dataframe
    df = pd.DataFrame(columns=['name','number'], data=[['cat',3]])
    df
      name  number
    0  cat       3
    # 添加一列,计算有多少条腿
    df['leg'] = df['number'] * 4
    # 添加一列,直接赋值有几个头
    df['head'] = 1
    df 
      name  number  leg  head
    0  cat       3   12     1
    
    1. 添加一列,采用insert()方法
    # 使用方法是DataFrame.insert(loc, column, value, allow_duplicates=False)
    # 即df.insert(添加列位置索引序号,添加列名,数值,是否允许列名重复)
    df.insert(1, 'tail', 1, allow_duplicates=False)
    df
      name  tail  number  leg  head
    0  cat     1       3   12     1
    

    不过在使用insert的过程中发现454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code)这个提示,猜测该方法可能已经过时了,不提倡使用了。

    主要参考资料:

    1. pandas.DataFrame.append
    2. pandas.DataFrame.insert

    相关文章

      网友评论

          本文标题:Python Pandas 向DataFrame中添加一行/一列

          本文链接:https://www.haomeiwen.com/subject/qqurjktx.html