美文网首页
python基础-13-数据分析python——pandas——

python基础-13-数据分析python——pandas——

作者: 比特跃动 | 来源:发表于2019-03-29 09:42 被阅读0次

本章内容包括: groupby的serives.avg和dataframe.loc


导入数据

//input1
import pandas as pd
position = pd.read_csv('DataAnalyst_utf.csv',encoding='utf')
position.groupby(by = ['city','education']).mean()




//output1
positionId   bottom top avg      city   education               
上海  不限  2.136313e+06    10.147059   17.955882   14.051471
博士  2.318894e+06    11.000000   19.000000   15.000000
大专  2.224099e+06    10.045455   16.745455   13.395455
本科  2.163757e+06    13.420168   22.686275   18.053221
硕士  2.123804e+06    13.767123   24.410959   19.089041
北京  不限  2.222436e+06    11.292683   19.983740   15.638211
博士  1.268134e+06    17.500000   32.500000   25.000000
大专  2.321920e+06    9.206349    15.539683   12.373016
本科  2.194100e+06    14.235546   24.657388   19.446467
硕士  2.193679e+06    14.500000   25.073333   19.786667
南京  不限  2.512235e+06    5.000000    9.000000    7.000000
大专  2.123662e+06    7.090909    11.454545   9.272727
本科  2.235469e+06    8.366667    14.500000   11.433333
硕士  2.481681e+06    9.500000    17.500000   13.500000
厦门  不限  1.773008e+06    8.333333    16.666667   12.500000
大专  2.048278e+06    4.714286    8.857143    6.785714
本科  1.902825e+06    8.444444    15.166667   11.805556
硕士  2.296814e+06    10.500000   21.000000   15.750000
天津  不限  2.378458e+06    3.000000    4.000000    3.500000
大专  2.517176e+06    4.250000    6.750000    5.500000
本科  2.132332e+06    7.066667    11.533333   9.300000
广州  不限  2.224884e+06    6.833333    11.666667   9.250000
大专  2.274389e+06    6.867470    11.228916   9.048193
本科  2.191311e+06    10.418103   17.922414   14.170259
硕士  2.374382e+06    10.714286   18.428571   14.571429
成都  不限  2.347340e+06    7.625000    13.500000   10.562500
大专  2.232275e+06    8.115385    13.884615   11.000000
本科  2.205122e+06    10.061856   17.288660   13.675258
硕士  1.869038e+06    9.500000    16.000000   12.750000
杭州  不限  2.256184e+06    13.000000   23.538462   18.269231
大专  2.259643e+06    8.862069    15.793103   12.327586
本科  2.178153e+06    12.142857   21.607973   16.875415
硕士  2.271047e+06    15.611111   25.888889   20.750000
武汉  不限  2.096199e+06    8.100000    13.800000   10.950000
大专  2.016487e+06    8.071429    14.357143   11.214286
本科  2.153728e+06    8.159091    14.840909   11.500000
硕士  2.551938e+06    6.000000    8.000000    7.000000
深圳  不限  2.172441e+06    11.450000   18.750000   15.100000
博士  1.259338e+06    30.000000   40.000000   35.000000
大专  2.216348e+06    10.563830   17.234043   13.898936
本科  2.119014e+06    13.261538   23.674359   18.467949
硕士  2.079558e+06    12.764706   23.294118   18.029412
苏州  大专  1.835047e+06    10.600000   18.600000   14.600000
本科  2.149926e+06    10.448276   18.172414   14.310345
硕士  2.569695e+06    12.000000   21.666667   16.833333
西安  不限  1.847092e+06    5.000000    9.000000    7.000000
大专  2.400272e+06    6.400000    9.900000    8.150000
本科  2.158057e+06    8.833333    15.583333   12.208333
硕士  2.445967e+06    4.000000    6.000000    5.000000
长沙  不限  2.317809e+06    6.285714    9.000000    7.642857
大专  2.069686e+06    6.000000    12.000000   9.000000
本科  2.046988e+06    7.466667    13.800000   10.633333
硕士  2.192339e+06    6.000000    12.000000   9.000000








//input2
position.groupby(by = ['city','education']).mean().loc['上海','博士']


//output2
positionId    2.318894e+06
bottom        1.100000e+01
top           1.900000e+01
avg           1.500000e+01
Name: (上海, 博士), dtype: float64









//input3
position.groupby(by = ['city','education']).mean().avg



//output3
city  education
上海    不限           14.051471
      博士           15.000000
      大专           13.395455
      本科           18.053221
      硕士           19.089041
北京    不限           15.638211
      博士           25.000000
      大专           12.373016
      本科           19.446467
      硕士           19.786667
南京    不限            7.000000
      大专            9.272727
      本科           11.433333
      硕士           13.500000
厦门    不限           12.500000
      大专            6.785714
      本科           11.805556
      硕士           15.750000
天津    不限            3.500000
      大专            5.500000
      本科            9.300000
广州    不限            9.250000
      大专            9.048193
      本科           14.170259
      硕士           14.571429
成都    不限           10.562500
      大专           11.000000
      本科           13.675258
      硕士           12.750000
杭州    不限           18.269231
      大专           12.327586
      本科           16.875415
      硕士           20.750000
武汉    不限           10.950000
      大专           11.214286
      本科           11.500000
      硕士            7.000000
深圳    不限           15.100000
      博士           35.000000
      大专           13.898936
      本科           18.467949
      硕士           18.029412
苏州    大专           14.600000
      本科           14.310345
      硕士           16.833333
西安    不限            7.000000
      大专            8.150000
      本科           12.208333
      硕士            5.000000
长沙    不限            7.642857
      大专            9.000000
      本科           10.633333
      硕士            9.000000
Name: avg, dtype: float64








//input4
position.groupby(by = ['city','education']).mean().avg['上海']



//output4
education
不限    14.051471
博士    15.000000
大专    13.395455
本科    18.053221
硕士    19.089041
Name: avg, dtype: float64

相关文章

网友评论

      本文标题:python基础-13-数据分析python——pandas——

      本文链接:https://www.haomeiwen.com/subject/zaskbqtx.html