1.数据读取
import pandas as pd
data = pd.read_csv("文件名")
2.数据初描述
data.info() ------ 描述每一列的非空数值个数以及数据类型 (Series无此参数)
data.describe() ------ 描述每一列数据的个数、最大、最小、平均值、方差等
data.head() ------ 列出头部前五行
data.columns ------ 数据的列名称
data.index ------- 数据的行名称
data.columns.tolist() -------将矩阵转换为列表形式
3.数据索引、切片
3.1 行索引 ----- loc 和 iloc
loc 轴标签索引
data.loc["行名称"](如果为数字,则没有引号)、data.loc[["行1",“行2”,,,,]](若为多列,需用中括号)
loc 轴标签切片
data.loc[["行1",“行2”,,,,],["列1",“列2”,,,,]],基本结构为data.loc[[行],[列]]
iloc 整数索引
data.iloc[1](索引第二行数据)、data.iloc[[1,2,3,4]]、data.iloc[:,:3]
iloc 整数切片同上
3.2 列索引
data["列名称"]、data[["列1",“列2”,,,,]]
补充:行选择语法
data[1:3]-----可直接取出1-2行的数据;
4. 数据选择
data[data["列x"] > N]------ 列x中大于N的所有数据
网友评论