pandas是基于NumPy的数据分析工具,提供了大量能使我们快速便捷地处理数据的函数和方法。
首先安装pandas
pip install pandas
pandas依赖安装
pandas处理以下3个数据结构,其中DataFrame用的最多:
- 系列(Series),维度:一维
- 数据帧(DataFrame),维度:二维
- 面板(Panel),维度:三维
import pandas as pd
s = pd.Series(data=[1, 2, 3, 4, 5], index=[1001, 1002, 1003, 1004, 1005])
print(s)
Series操作
import pandas as pd
import numpy as np
df = pd.DataFrame({"id": [1001, 1002, 1003, 1004, 1005, 1006],
"date": pd.date_range('20130102', periods=6),
"city": ['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '],
"age": [23, 44, 54, 32, 34, 32],
"category": ['100-A', '100-B', '110-A', '110-C', '210-A', '130-F'],
"price": [1200, np.nan, 2133, 5433, np.nan, 4432]},
columns=['id', 'date', 'city', 'category', 'age', 'price'])
print(df)
print("----"*15)
# 查看前3条
print(df.head(3))
print("----"*15)
# 查看后2条
print(df.tail(2))
运行结果:
DataFrame操作
网友评论