李媛今年刚毕业,加入了一家大型的中介公司,连连家园。李媛的老大十分器重他,这不,刚入职不久,老大就给她扔过来一个csv文件,让她看看这个数据能不能看出啥端倪来。
李媛作为一个中文系的才女,岂能被这种事给难倒?她打开csv,看着密密麻麻的数据,脑仁立马就疼起来了。心里暗暗骂道:现在这些老板啊,看到一个女的,就以为一定熟练使用excel,老娘我没学过啊。
光疼没啥用啊。李媛愁眉不展,连饭都少吃了两碗,晚上一早就回家了,躺床上在想着咋交差呢。
这个时候,微信响起来了。
“喂喂喂,大妞,你干嘛呢?”
原来是自己的同班同学,高渐离。
“贱人,别烦我。老娘我被老板逼的,大姨妈都提前来了。非让我看一个啥csv文件,看看有啥规律。老娘我不会excel啊”
“嚯,瞧你这出息!真给咱社团丢人”。李媛跟高渐离大学时同一个社团,路透社。这个社团专门钻研校园八卦,李媛负责写,高渐离负责电子传媒。还出了一个校园小报,好几次由于报告学校某些方面,差点被取缔。就在这种环境中培养出了他俩的革命友谊。高渐离看李媛半天也不说话,就给出主意
“哎,我记得你以前会一点点python是不?”高渐离发出一个挑逗的眼神。
“嗯啊,那又咋地?”
“python可以处理csv啊,而且特别简单。”
“我就会一丢丢啊。。。。。”李媛发出一个挖鼻屎的表情。
“一丢丢就够了”。高渐离发出一个加油的姿势。“我现在来教你怎么用python处理csv.文件。上QQ”
高渐离共享桌面,然后开启数据趣味书的第一课:
python处理CSV文件
- 安装pandas库
pip install pandas
- 读取csv文件
import pandas as pd
trainfile = "C:/Users/GaoJianli/Desktop/train.csv"
df = pd.read_csv(trainfile)
“我有个问题,贱贱”。李媛发出一个大脸猫疑问的表情,“那个我如果想输出某列的数据怎么读?我想输出某行的数据呢?”
“好问题”
- 数据访问
print df["SalePrice"] #SalePrice这一列数据
print df[0:1] #第0行数据
print df["Id"][0],df["SalePrice"][0] #Id这一列,第0行数据;SalePrice这一列的,第0行数据
“那如果我想了解下,某列中都有多少个不同的值呢?又或者我想求和,求平均呢?我想根据某列排序呢?”李媛开始了夺命三连问。
- 数据统计
df["SalePrice"].count() #个数
df["SalePrice"].sum() #求和
df["SalePrice"].mean() #求平均
df["SalePrice"].unique() #看不同的值
df.sort_values(['SalePrice','LotArea'],ascending=[True, False]) #按SalePrice升序对整个表进行排序,当遇到SalePrice一样时,按照LotArea的降序往下排
“贱贱,你太厉害了!”李媛发来一个桃心眼。“么么哒!”
“嘿嘿嘿”,高渐离发出一个费玉清的表情。
网友评论