大数据学习思路分解(2):机器学习

作者: 尚学先生 | 来源:发表于2018-05-30 10:12 被阅读6次

机器学习是整套大数据学习线路里的第二部分内容,知识点相对来说不是很多,但也是大数据开发中最常用的一部分内容。

那么我们就开始对机器学习部分要学习的知识点进行个整理:

1、r语言机器学习

r语言是一款十分优秀的数据分析和数据可视化软件,同时作为第一代机器学习的工具,其中包括大量用于机器学习的添加包。

此部分需要掌握:r语言简单的介绍、基本函数、数据类型、线性回归、朴素贝叶斯聚类、决策树分类、神经网络等等

2、Mahout机器学习

Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。Mahout通过使用 Apache Hadoop,可以有效地扩展到云中。

此部分需要掌握:使用的原因、配置安装及步骤说明、分类概念、工作原理等等

3、项目实战

项目实战以微博营销数据挖掘项目为主,主要运用到的框架体系有

a)分布式平台 Hadoop,MapReduce

b) 数据采集 Flume

c) 数据清洗 ETL

d) 数据库 Hbase,Redis

e) 机器学习 Mahout

小伙伴们需要系统的学习资料可以给我留言哦,或者找文章内的qq直接加我好友领取。

相关文章

  • 大数据学习思路分解(2):机器学习

    机器学习是整套大数据学习线路里的第二部分内容,知识点相对来说不是很多,但也是大数据开发中最常用的一部分内容。 那么...

  • Coursera台大机器学习基础课程学习笔记2 -- 机器学习的

    Coursera台大机器学习基础课程学习笔记2 -- 机器学习的分类 总体思路: 各种类型的机器学习分类 按照输出...

  • 机器学习

    1、人工智能->机器学习->深度学习 注:->包含关系 2、机器学习领域: 模式识别=机器学习 数据挖掘=机器学习...

  • 大数据学习思路分解(1):hadoop学习

    我们在上篇文章中大概的了解了大数据学习的一些思路(路线),主要包括以下几点(Linux+hadoop+机器学习+流...

  • 大数据学习思路分解1:hadoop学习

    我们在上篇文章中大概的了解了大数据学习的一些思路(路线),主要包括以下几点(Linux+hadoop+机器学习+流...

  • 2019-02-17

    机器学习系列 机器学习100天 机器学习第1天:数据预处理 机器学习第2天:简单线性回归模型 机器学习第3天:多元...

  • 机器学习简介

    1、何谓机器学习 机器学习就是把无序的数据转换成有用的信息 2、开发机器学习应用程序的步骤 收集数据(爬虫、设备收...

  • 机器学习—路线图

    机器学习数据处理步骤: 机器学习基础与实践(一)----数据清洗 机器学习基础与实践(二)----数据转换 机器学...

  • 机器学习中比较活跃的四大领域

    机器学习中比较活跃的四大应用领域 数据挖掘 用机器学习方法,发现数据之间的关系 计算机视觉 用机器学习方法,让计算...

  • 机器学习-Scala实现(一)

    机器学习定义 机器学习完善了编程的思路,从通过编程的方式明确指定规则到从数据中通过一定算法自动学习提取规则,然后用...

网友评论

    本文标题:大数据学习思路分解(2):机器学习

    本文链接:https://www.haomeiwen.com/subject/ncktsftx.html