美文网首页数据分析程序员
数据趣味书——第一章,小李媛头大看数据,高渐离义气教panda

数据趣味书——第一章,小李媛头大看数据,高渐离义气教panda

作者: 墨攻科技 | 来源:发表于2017-09-27 20:57 被阅读24次

    李媛今年刚毕业,加入了一家大型的中介公司,连连家园。李媛的老大十分器重他,这不,刚入职不久,老大就给她扔过来一个csv文件,让她看看这个数据能不能看出啥端倪来。
    李媛作为一个中文系的才女,岂能被这种事给难倒?她打开csv,看着密密麻麻的数据,脑仁立马就疼起来了。心里暗暗骂道:现在这些老板啊,看到一个女的,就以为一定熟练使用excel,老娘我没学过啊。
    光疼没啥用啊。李媛愁眉不展,连饭都少吃了两碗,晚上一早就回家了,躺床上在想着咋交差呢。
    这个时候,微信响起来了。
    “喂喂喂,大妞,你干嘛呢?”
    原来是自己的同班同学,高渐离。
    “贱人,别烦我。老娘我被老板逼的,大姨妈都提前来了。非让我看一个啥csv文件,看看有啥规律。老娘我不会excel啊”
    “嚯,瞧你这出息!真给咱社团丢人”。李媛跟高渐离大学时同一个社团,路透社。这个社团专门钻研校园八卦,李媛负责写,高渐离负责电子传媒。还出了一个校园小报,好几次由于报告学校某些方面,差点被取缔。就在这种环境中培养出了他俩的革命友谊。高渐离看李媛半天也不说话,就给出主意
    “哎,我记得你以前会一点点python是不?”高渐离发出一个挑逗的眼神。
    “嗯啊,那又咋地?”
    “python可以处理csv啊,而且特别简单。”
    “我就会一丢丢啊。。。。。”李媛发出一个挖鼻屎的表情。
    “一丢丢就够了”。高渐离发出一个加油的姿势。“我现在来教你怎么用python处理csv.文件。上QQ”
    高渐离共享桌面,然后开启数据趣味书的第一课:

    python处理CSV文件

    1. 安装pandas库
    pip install pandas
    
    1. 读取csv文件
    import pandas as pd
    trainfile = "C:/Users/GaoJianli/Desktop/train.csv"
    df = pd.read_csv(trainfile)   
    

    “我有个问题,贱贱”。李媛发出一个大脸猫疑问的表情,“那个我如果想输出某列的数据怎么读?我想输出某行的数据呢?”
    “好问题”

    1. 数据访问
    print df["SalePrice"]  #SalePrice这一列数据
    print df[0:1]  #第0行数据
    print df["Id"][0],df["SalePrice"][0]  #Id这一列,第0行数据;SalePrice这一列的,第0行数据
    

    “那如果我想了解下,某列中都有多少个不同的值呢?又或者我想求和,求平均呢?我想根据某列排序呢?”李媛开始了夺命三连问。

    1. 数据统计
    df["SalePrice"].count()   #个数
    df["SalePrice"].sum()     #求和
    df["SalePrice"].mean()   #求平均
    df["SalePrice"].unique()  #看不同的值
    df.sort_values(['SalePrice','LotArea'],ascending=[True, False]) #按SalePrice升序对整个表进行排序,当遇到SalePrice一样时,按照LotArea的降序往下排
    

    “贱贱,你太厉害了!”李媛发来一个桃心眼。“么么哒!”
    “嘿嘿嘿”,高渐离发出一个费玉清的表情。

    相关文章

      网友评论

        本文标题:数据趣味书——第一章,小李媛头大看数据,高渐离义气教panda

        本文链接:https://www.haomeiwen.com/subject/krlpextx.html