参考《Python机器学习基础教程》
参考 国外有关 pandas 库的教程
为什么是 Python
今天 Python 已经成为许多数据科学应用的通用语言。如果想学习机器学习除了 python 当然还可以使用 R、matlab 或者c++ 来进行机器学习,不过前提是你了解这些语言中一种,如果你对这些语言都不算了解,那就推荐你使用 python
常用的 Python 库
Scipy
在 Numpy 基础添加了众多科学计算工具包
numpy
Numpy 是科学计算的基础包,主要处理多维数组,高级数学函数。
- numpy 可以高效率生成多维数组(矩阵)
- 结构化数据更利于计算
Python 科学应用库 numpy(1)
x = np.array([[1,2,3],[3,4,5]])
print("x:\n{}".format(x))
x:
[[1 2 3]
[3 4 5]]
matplotlib
matplotlib 是 Python 主要的科学绘图库,将数据内容以可视化表示出来,提供丰富的绘图库。
%matplotlib inline
import matplotlib.pyplot as plt
x = np.linspace(-10,10,100)
y = np.sin(x)
plt.plot(x,y,marker="x")
图
pandas
pandas 是用于处理和分析数据的 Python 库。pandas 的提供模仿 R 语言中的 DataFrame 的数据结构。
DataFrame 类似 Excel 表格,可以像 SQL 一样对表格进行查询和连接。
import pandas as pd
from IPython.display import display
data = {"Title":["Angular","React","Vue"],"Author":["Zidea","Zidea","Matthew"],"Courses":[12,12,10]}
data_pandas = pd.DataFrame(data)
display(data_pandas)
图
网友评论