本人入手学Python, 把datacamp上的data scientists track课程分成了几个子版块。
基础知识:
Introduction to Python
Intermediate Python for DS
Python Data Science Toolbox(Part 1)
Python Data Science Toolbox(Part 2)
主要目标:
1.熟悉知道基本的概念
2.list, arrays,字典,dataframe的处理
3.会使用基本的numpy->arrays和matplotlib做可视化
4.编写基本的函数(function)
Importing Data in Python(Part 1)
Importing Data in Python(Part 2)
Cleaning Data in Python
1.数据的导入(SQL/Excel/SAS/web)
2.Web和API的数据导入
3.基本的数据清洗
Pandas
提供了一种适用于上层数据分析的表结构,dataframe
是基于numpy的一种数据分析工具,最具有统计意味的工具包。
数据结构有一维的series,二维的dataframe,三维的panel
Pandas Foundations
Manupulating DataFrames with Pandas
Merging DataFrames with Pandas
Analyzing Police Activity with Pandas
目标:
1.汇总和计算,描述性统计,处理缺失化数据,层次化索引
2.清理、转换、合并、重塑、groupby技术
3.日期以及时间数据类型以及工具
Introduction to Relational Databases in SQL
Joining Data in SQL
放到sql里面系统再学
Introduction to Data Visualization with Python
Interactive Data Visualisation with Bokeh
目标:
1.绘制各种类型的图,散点图/箱线图/条形图/直方图,基本的标注和填充
2.适用bokeh绘图
Statistical Thinking in Python(Part 1)
Statistical Thinking in Python(Part 2)
目标:
基本的统计学,参数估计和假设检验
Introduction to Shell for Data Science
Conda Essentials
放到最后学习
机器学习相关:
Supervised Learning with scikit-learn
Machine Learning with Experts:School Budgets
Unsupervised Learning in Python
Machine Learning with Tree-Based Models in Python
深度学习和网络分析:
Deep Learning in Python
Network Analysis in Python(Part 1)
假期:
基础知识->pandas->统计分析->(如果有时间加餐,加机器学习那里)
网友评论