美文网首页机器学习与深度学习
7、机器学习自学指南

7、机器学习自学指南

作者: 攻城狮笔记 | 来源:发表于2019-02-23 10:00 被阅读18次

    你可以做很多关于机器学习的事情。

    您可以使用书籍和课程等资源,可以输入的比赛和可以使用的工具。

    在这篇文章中,我想在这些活动中加入一些结构,并建议在从程序员到机器学习大师的旅途中解决什么问题。

    四级机器学习

    考虑机器学习的四个级别的能力。这是一个模型,可以帮助我们思考可用的资源和活动,以及何时可以解决它们的好时机。

    1. 初学者
    2. 初学者
    3. 中间
    4. 高级

    我想在这里将初学者与新手分开,因为我想表明绝对的初学者(对该领域感兴趣的程序员)如果他们选择的话,他们之前就有一条路径。

    我们将浏览这四个级别中的每一个级别,并查看可以帮助某个级别的人学习更多知识和技能水平的资源和活动。

    细分只是一个建议,很可能在某个级别之前或之后的某个活动或资源在细分的给定级别上非常有用和适当。

    我认为整体结构很有用,我很想听听你的想法,在下面留下你的想法。

    四级机器学习

    归功于pugetsoundphotowalks,保留一些权利

    初学者

    初学者是对机器学习感兴趣的程序员。他们可能已经开始读一本书,维基百科页面,或一门课程采取了一些教训,但他们并不真正“ 明白 ”了。他们感到沮丧,因为他们得到的建议是中间体和高级水平。

    初学者需要一个温和的介绍。远离代码和教科书和课程。他们需要首先指出的原因和最新情况,为新手级材料奠定基础。

    绝对初学者的一些活动和资源是:

    初学者

    新手与机器学习领域有过一些联系。他们读了一本书或上了一门课。他们知道他们感兴趣,他们想知道更多。他们开始得到它,并希望开始完成任务。

    新手需要做点什么。他们需要付诸行动,使材料扎根并融入现有的知识结构,如他们所熟悉的编程语言或他们习惯解决的问题。

    新手的一些活动和资源是:

    • 完成课程:学习并完成斯坦福机器学习课程。记下大量笔记,尽可能完成作业,提出很多问题。
    • 阅读一些书籍:不是教科书,而是上面列出的那些针对初学者程序员的友好书籍。
    • 学习工具:学习驾驶Scikit-LearnWEKAR等类似的工具或库。具体来说,了解如何使用您在书籍或课程中阅读或了解的算法。看到它在行动,并习惯在学习它们时尝试。
    • 编写一些代码:实现更简单的算法,如感知器,k近邻或线性回归。编写一些程序来揭开方法的神秘面纱,并学习使其发挥作用所需的所有微观决策。
    • 完整教程:关注并完成教程。开始构建一个包含数据集,脚本甚至源代码的小项目目录,您可以回顾,阅读和思考。

    中间

    新手已阅读一些书籍并完成了一些课程。他们知道如何驱动一些工具并编写了一堆代码来实现简单的算法和完成教程。一个中间人正在自己爆发,设计自己的项目来学习新技术,并与更大的社区进行互动和学习。

    中级正在学习如何准确,有效和稳健地实施和运用算法。他们还建立了预先花费大量时间处理数据,清理,总结和思考可以回答的问题类型的技能。

    中间体的一些活动和资源是:

    • 小项目:设计小型编程项目和实验,其中机器学习可用于解决问题。这就像设计和执行您自己的教程一样,以探索您感兴趣的技术。您可以实现算法或链接到提供算法的库。详细了解小型项目
    • 数据分析:习惯于探索和总结数据集。自动化报告,了解何时使用哪些工具,并查找可以探索,清理的数据,以及可以练习技术和交流有趣内容的数据。
    • 阅读教科书:阅读和内化有关机器学习的教科书。这可能需要技能来熟悉技术的数学描述并承认描述问题类和算法的形式。
    • 编写插件:为开源机器学习平台和库编写插件和包。这是学习如何编写健壮的生产级算法实现的练习。在项目中使用您自己的插件,请求社区进行代码审查,并尽可能将代码包含在平台中。获得反馈和学习是我们的目标。
    • 比赛:参加机器学习比赛,例如与会议相关或在Kaggle等平台上提供的比赛。参与讨论,提出问题,了解其他从业者如何处理问题。添加到您可以绘制的项目,方法和代码的存储库中。

    高级

    一位高级从业者编写了大量代码,既可以集成机器学习算法,也可以自己实现算法。他们可能参加过比赛或书面插件。他们阅读了教科书,完成了课程,对该领域有广泛的了解,并对他们喜欢的一些关键技术有深入的了解。

    高级从业者构建,部署和维护使用机器学习的生产系统。他们随时了解各个领域的新发展,并急切地寻找并了解一种方法的细微差别以及从其他前线从业者那里传来的技巧。

    高级从业者的一些活动和资源是:

    • 自定义算法:修改算法以满足其需求,这可能涉及实现类似问题域的会议和期刊论文中概述的自定义。
    • 新算法:根据潜在的形式设计全新的方法,以应对他们遇到的挑战。它更多的是关于获得最佳结果而不是推进该领域的前沿。
    • 案例研究:阅读甚至重新创建机器学习竞赛和其他从业者的案例研究。这些“我是如何做的”论文和帖子通常充满了数据准备,特征工程和技术使用的微妙专业技巧。
    • 方法论:流程的系统化,无论是正式的还是为自己的。他们有办法解决问题并在此时获得结果,他们正在积极寻找方法,通过提示,最佳实践和新的更好的技术进一步完善和改进流程。
    • 研究:参加会议,阅读研究论文和专着,与该领域的专家进行对话。他们可能会写下他们的一些作品并将其提交出版,或者只是将其放入博客文章中并重新开始工作。

    掌握是连续的,学习不会结束。人们可以在这个旅程的任何一点暂停和绕行,成为“ 竞争人物”或“ 专业图书馆人 ”。事实上,我希望这种弯路成为常态。

    相关文章

      网友评论

        本文标题:7、机器学习自学指南

        本文链接:https://www.haomeiwen.com/subject/yimuyqtx.html