## 语言方面
语言首选是 python ,吃透 python ,大部分机器学习都提供 python 版本。可能 python 在数学科学领域也被广泛应用的可能。
框架方面
numpy 是必备,很多库都提供替换对 numpy 中提供的方法的方法。同时也实现和其内部自有数据类型到 numpy 类型转换的方法。就这两点我们就可以看出 numpy 无论在机器学习还是数据挖掘中都有十分重要的地位。
mxnet
mxnet 的很多作者都是中国人,希望国人大力支持一下,不过他被亚马逊收了,其最大的贡献组织为百度。。在学习《动手学深度学习》时接触到,感觉 Api 和 pyTorch 很类似,不过 github 用 mxnet 实现项目不多,
keras
今天 keras 作为 Api 层面上框架变的这么火,不能不说明像 tensorflow 等这些机器学习框架在 Api 的设计上,并不是那么优雅,对于直接用户还不是很友好。而且有了 keras 我们就省去了一些基础工作,可以快速实现一些经典网络结构,而且无需了解更多神经网络背后实现。
不过 keras 毕竟是在其他框架包裹一层而来的,这样可能就会存在一些潜在问题,首先如果 backend 版本更新了,keras 是否会即时更新,第二个就是我们始终是拿到二手的,性能上相比原来是会有问题。不过这也只是我个人猜测,可能性能会更好,也没准。我现在还没到考虑性能问题,所以个人主要学的就是 keras。
tensorflow
tensorflow 应该是大而全,生态应该不错,还有 Android 版本,前端还有 tensorflowjs。
pandas
这是 python 中的 excel 表,将数据表格化呈现出来,除此之外还提供许多好用的方法帮助我们处理和操作数据。
matlibplot
这个数据可视化的库,可能我们在机器学习中用他的机会要小于在数据挖掘中用到这个库的机会。因为在数据挖掘中,我们有时候通过观察数据各种图,可以帮助更好更直观理解数据,便于分析数据。
网友评论