美文网首页我爱编程
春节期间自我培训计划

春节期间自我培训计划

作者: SeanC52111 | 来源:发表于2018-01-19 12:53 被阅读0次

获取数据(约3h):

  1. 获取互联网上的公开数据集
  2. 用网站 API 爬取网页数据
  3. 爬虫所需的 HTML 基础
  4. 基于 HTML 的爬虫,Python(Beautifulsoup)实现
  5. 网络爬虫高级技巧:使用代理和反爬虫机制
  6. 应用案例:爬取豆瓣 TOP250 电影信息并存储


    image.png

数据存储与预处理(3h)

  • review SQL;
  • 数据库进阶操作:数据过滤与分组聚合
  • 用 Python 进行数据库连接与数据查询
  • 其他类型数据库:SQLite&MongoDB
  • 用 Pandas 进行数据预处理:数据清洗与可视化

统计学基础与 Python 数据分析
)探索型数据分析:绘制统计图形展示数据分布
2)通过统计图形探究数据分布的潜在规律
3)描述统计学:总体、样本和误差,基本统计量
4)推断统计学:概率分布和假设检验
5)在实际分析中应用不同的假设检验
6)预测型数据分析:线性回归
7)Python中进行线性回归(scikit-learn实现)

  1. 预测型数据分析:分类及逻辑回归
  2. 其它常用算法(k近邻、决策树、随机森林)
  3. 预测型数据分析:聚类算法(k均值、DBSCAN)
  4. 用特征选择方法优化模型
  5. 用 scikit-learn 实现数据挖掘建模全过程
  6. 用 rapidminer 解决商业分析关键问题
  7. 高级数据分析工具:机器学习、深度学习初探

先复习台湾交通大学统计学基础、进阶
统计学:http://ocw.nctu.edu.tw/upload/classbfs12090115581527.pdf
http://ocw.nctu.edu.tw/upload/classbfs120901161347184.pdf
高级统计学课件:http://ocw.nctu.edu.tw/upload/classbfs1209012042138837.pdf
尽量完成机器学习实战的主要不熟悉部分代码(决策树、randomforest、svm、kmeans)
周志华的机器学习理论推导辅助理解
svm以及高维量的推导涉及到向量运算(求导),给出台湾交通大学课件http://ocw.nctu.edu.tw/course_detail-s.php?bgid=1&gid=1&nid=14

相关文章

  • 春节期间自我培训计划

    获取数据(约3h): 获取互联网上的公开数据集 用网站 API 爬取网页数据 爬虫所需的 HTML 基础 基于 H...

  • 2018年总结与新年计划

    今年的总结与计划来的有点迟,原定在春节期间完成,结果太高估春节期间自我约定能力了,带回去的书,还是在路上看完了《战...

  • 周记(1.13~1.19)

    一,本周作息情况: 自我是评价:中上 二,下周计划: 利用春节期间的时间,做到以下几点: 1.把从2018年11月...

  • 感受变化

    春节期间最好不要做什么计划,因为计划赶不上变化,一切顺其自然比较好。 本来准备在春节期间每天直播两小时,没想到外地...

  • 春节期间

    时光飞快 ,一转眼 元宵节过完了 这个年也差不多算是完了。 反思了一下自己,春节期间停止了学习进步的状态。导致整个...

  • 春节期间

    一如既往的期待春节的到来,爆竹声中一岁除。 不知道从什么时候开始,我好像不喜欢过春节起来,因为就那几样东西,就那几...

  • 春节期间

    2019.02.01今天晚上八点的票 坐上高铁 踏上回家的路程 和女儿和闺蜜三人坐着一起 海口东时上来一个我们三人...

  • 春节期间

    从回来到现在大年初三,每天都好吃好喝,朋友的聚会可以硕的是隔三差五!还是和要好的朋友玩的比较开,还有过年最头...

  • 春节期间

    春节期间的人,可以分为两类。一类是需要回家的人,另一类是不需要回家的人。 在自给自足的耕农经济时代,中国人以家庭为...

  • 春节期间

    春节有感 串亲访友冒寒潮,风冽冰封喜气缭。 窗外霓虹如梦幻,群中景致贯天遥。 健身不辍晨辉送,诗画还随暮志招。 技...

网友评论

    本文标题:春节期间自我培训计划

    本文链接:https://www.haomeiwen.com/subject/hayooxtx.html