pandas常用函数
import pandas as pd
pd.__version__
导入并读取数据
path = ".//exercise_data/chipotle.tsv"
chipo = pd.read_csv(path,sep = '\t')
常用的pandas数据读取函数
pd.read_excel() # 读取excel格式文件
pd.read_csv() # 读取csv格式文件
注意:csv与tsv格式文件都是使用pd.read_csv()读取,但tsv文件的分隔符是制表符'\t',而csv文件的分隔符为逗号',',函数默认的分隔符为逗号,注意修改分隔符(参数sep)
查看数据前几行内容
chipo.head() # 默认5行
chipo.head(10) # 查看数据前10行
查看数据最后几行
chipo.tail() #默认5行
chipo.tail(10) # 查看数据后10行
查看数据统计情况
chipo.describe() # 返回数据的count、mean、std、min、max、3个四分位数
查看数据的大小
chipo.size # 返回数据的大小:行数*列数,注意没有括号
查看数据的形状
chipo.shape # 返回二维数组:(行数,列数)
查看数据列名称
chipo.columns
查看数据索引
chipo.index # 返回的是行索引信息
不同值计数
chipo.nunique() # 返回的是不同值的个数
区分:
chipo.unique() # 返回的是不同值
查看某个字段中有哪些不同的值,并计算每个值有多少个重复值
chipo['choice_description'].value_counts()
重置索引
chipo.reset_index(drop=True)
字段求和
chipo['quantity'].sum()
网友评论