美文网首页我爱编程
20170525 周四 pandas

20170525 周四 pandas

作者: ZhangShiHao | 来源:发表于2017-05-26 17:20 被阅读0次

    code: pandas入门与时间序列分析.ipynb

    1. 完成 http://www.icourse163.org/learn/BIT-1001870002?tid=1001963001#/learn/examlist
      上的考试

    体会: pandas 的相关用法是在是太多了!随用随查:
    参考中文网站:
    https://zhuanlan.zhihu.com/p/25630700
    http://www.th7.cn/Program/Python/201412/329841.shtml
    http://www.cnblogs.com/zuizui1204/p/6423069.html
    和下载的 pandas-cheat-sheet

    1. 趁热打铁,学习 pandas:
      https://yq.aliyun.com/articles/81469

    dataframe 可以直接用 df.plot() 作图,然后 plt.show() 显示

    聚合: 往往根据索引 index 来 groupby, 可以根据日期,也可以根据周; 比如这里的index已经是 to_datatime 得到的;
    df.groupby(df.index.week).counts() 或 means()
    df.index.date

    意思就是:对这张含时的二维数据表中的信息进行处理,先按天或周聚合,得到的对象自然可以计数或求其平均值


    1. http://www.julyedu.com/video/play/66/614
      kaggle实战

    模型融合:
    1.bagging 解决过拟合
    如: 1:10的正负样本,可以将负样本分为10份,每份和正样本训练得出一个分类器/回归器,

    1.JPG

    使用 sklearn.ensemble.BaggingClassifier
    随机森林是其中的一种。

    Adaboost 调样本的权重

    相关文章

      网友评论

        本文标题:20170525 周四 pandas

        本文链接:https://www.haomeiwen.com/subject/vxtzxxtx.html