美文网首页
pandas的技巧

pandas的技巧

作者: thirsd | 来源:发表于2019-08-18 22:22 被阅读0次

1、DataFrame遍历行和新增行示例

import pandas as pd
df1 = pd.DataFrame([['1,2,3', 'a'], ['4', 'b']], columns=list('AB'))
#######
add_df = pd.DataFrame(columns=df1.columns)
for index, row in df1.iterrows():
  a_list = row['A'].split(',')
  if len(a_list) > 1:
    for i in a_list:
      row1 = row.copy(deep=True)
      row1['A'] = i
      add_df.loc[len(add_df.index)] = row1

df1 = df1.append(add_df)

2、记录数统计

import pandas as pd
df1 = pd.DataFrame([['1,2,3', 'a'], ['4', 'b'], ['4', 'b1']], columns=list('AB'))

df1['B'].value_counts()

3、重复记录清理

import pandas as pd
df1 = pd.DataFrame([['1,2,3', 'a'], ['4', 'b'], ['4', 'b'], ['4', 'b1']], columns=list('AB'))

df1 = df1.drop_duplicates(subset=['A','B'], keep='last')

4、读取Json文件

import pandas as pd
with open('data/net.json') as f:
  json_str = f.read()

df1 = pd.read_json(json_str, orient='records')

5、pandas 打印数据的选项

使用 pandas.set_option来控制选项,官方API参考

import pandas as pd
#显示所有列
pd.set_option('display.max_columns', None)
#显示5列
pd.set_option('display.max_columns', 5)
#显示所有行
pd.set_option('display.max_rows', None)
#显示5行
pd.set_option('display.max_rows', 5)
#设置行的宽度
#设置value的显示长度为100,默认为50
pd.set_option('display.max_colwidth',100)

相关文章

  • Numpy之数据保存与读取

      在pandas使用的25个技巧中介绍了几个常用的Pandas的使用技巧,不少技巧在机器学习和深度学习方面很有用...

  • pandas使用技巧【15】blank

    本系列文章列表pandas使用技巧总览

  • 入门Pandas,你必须掌握的技巧

    入门Pandas,必须掌握的技巧 总结自己经常使用的pandas操作方法: 创建DataFrame数据 查看数据相...

  • pandas的技巧

    1、DataFrame遍历行和新增行示例 2、记录数统计 3、重复记录清理 4、读取Json文件 5、pandas...

  • 数据分析工具PANDAS技巧-如何删除数据帧的列

    数据分析工具PANDAS技巧-如何删除数据帧的列 在本教程中,我们将介绍如何从pandas数据帧(datafram...

  • pandas高阶使用技巧

    pandas是机器学习中最常用的数据处理库,那么一些高级技巧你是否了解呢? apply函数 pandas中的lam...

  • Pandas系列5-DataFrame之过滤与分组

    Pandas的条件过滤是使用非常频繁的技巧,在这一节我们将看到各种不同的过滤技巧,如果读者有其它过滤技巧,也欢迎告...

  • Pandas使用技巧

    添加列并逐行设置值 从DataFrame获取特定列数据 完全构建新的DataFrame,并添加数据 导出csv时,...

  • Pandas 技巧(一)

    导语 在众多的科学计算库中,我认为Pandas对数据科学运算最有用。Pandas,加上Scikit-learn几乎...

  • Pandas技巧(二)

    7 数据框合并 当我们有收集自不同来源的数据时,合并数据框就变得至关重要。假设对于不同的房产类型,我们有不同的房...

网友评论

      本文标题:pandas的技巧

      本文链接:https://www.haomeiwen.com/subject/vjgdsctx.html