美文网首页
机器学习

机器学习

作者: Rain师兄 | 来源:发表于2021-08-24 18:00 被阅读0次

    机器学习是一种数据分析方法,可以自动构建分析模型。

    它是人工智能的一个分支,其理念是系统可以从数据中学习、识别模式并在最少的人工干预下做出决策。

    机器学习的发展

    由于新的计算技术,今天的机器学习不像过去的机器学习。

    它诞生于模式识别以及计算机无需编程即可学习执行特定任务的理论;

    对人工智能感兴趣的研究人员想看看计算机是否可以从数据中学习。机器学习的迭代方面很重要,因为当模型用于新数据时,它们能够独立适应。他们从以前的计算中学习,以产生可靠、可重复的决策和结果。

    这是一门并不新鲜的科学,但却获得了新的动力。

    虽然许多机器学习算法已经存在很长时间了,但自动将复杂的数学计算应用于大数据的能力——一遍又一遍,越来越快——是最近的发展

    以下是一些您可能熟悉的机器学习应用程序的广为人知的示例:
    1.大肆宣传的自动驾驶谷歌汽车?机器学习的本质。
    2.在线推荐优惠,例如来自 Amazon 和 Netflix 的优惠?日常生活中的机器学习应用。
    3.了解客户在 Twitter 上对您的评价吗?机器学习与语言规则创建相结合。
    4.欺诈检测?当今世界中更明显、更重要的用途之一。

    为什么机器学习很重要?

    对机器学习重燃兴趣的原因与那些使得数据挖掘和贝叶斯分析比过去更流行的因素是一样的。诸如不断增加的可用数据的数量和种类、更便宜、更强大的计算处理以及负担得起的数据存储等事情。

    所有这些都意味着可以快速自动地生成模型,这些模型可以分析更大、更复杂的数据并提供更快、更准确的结果——即使是在非常大规模的情况下。通过构建精确的模型,组织有更好的机会识别盈利机会——或避免未知风险

    创建良好的机器学习系统需要什么?

    数据准备能力。
    算法 - 基础和高级。
    自动化和迭代过程。
    可扩展性。
    集成建模。

    你知道吗?

    在机器学习中,目标称为标签。
    在统计学中,目标被称为因变量。
    统计学中的变量在机器学习中称为特征。
    统计学中的转换在机器学习中称为特征创建。

    谁在使用它?

    大多数需要处理大量数据的行业都认识到了机器学习的价值。

    1.金融服务
    金融行业的银行和其他企业将机器学习技术用于两个关键目的:识别数据中的重要见解,并防止欺诈。这些见解可以识别投资机会,或帮助投资者了解何时进行交易。数据挖掘还可以识别具有高风险特征的客户,或使用网络监视来查明欺诈的警告信号。

    2.政府
    公共安全和公用事业等政府机构对机器学习有特别的需求,因为它们有多种数据源可以挖掘以获取洞察力。例如,分析传感器数据可以确定提高效率和节省资金的方法。机器学习还可以帮助检测欺诈并最大程度地减少身份盗用。

    3.医疗保健
    机器学习是医疗保健行业的一个快速增长趋势,这要归功于可穿戴设备和传感器的出现,这些设备和传感器可以使用数据实时评估患者的健康状况。该技术还可以帮助医学专家分析数据,以识别可能导致改进诊断和治疗的趋势或危险信号。

    4.零售
    根据以前的购买历史来推荐您可能喜欢的商品的网站正在使用机器学习来分析您的购买历史。零售商依靠机器学习来捕获数据、对其进行分析并使用它来个性化购物体验、实施营销活动、价格优化、商品供应计划以及客户洞察。

    5.石油和天然气
    寻找新能源。分析地下的矿物质。预测炼油厂传感器故障。简化油品分配,使其更高效、更具成本效益。该行业的机器学习用例数量众多,而且还在不断扩大。

    6.交通
    分析数据以识别模式和趋势是运输业的关键,运输业依赖于提高路线效率并预测潜在问题以提高盈利能力。机器学习的数据分析和建模方面是快递公司、公共交通和其他运输组织的重要工具。

    有哪些流行的机器学习方法?

    两种最广泛采用的机器学习方法是监督学习和无监督学习——但也有其他机器学习方法。以下是最流行的类型的概述。

    1.Supervised learning
    使用标记示例训练算法。例如已知所需输出的输入。

    学习算法接收一组输入以及相应的正确输出,并且算法通过将其实际输出与正确输出进行比较来学习以发现错误,然后相应地修改模型。通过分类、回归、预测和梯度提升等方法,监督学习使用模式来预测其他未标记数据上的标签值。监督学习通常用于历史数据预测未来可能发生的事件的应用中。

    例如,它可以预测信用卡交易何时可能是欺诈性的,或者哪个保险客户可能会提出索赔。

    2.Unsupervised learning
    用于没有历史标签的数据,系统不会被告知“正确答案”。

    目标是探索数据并找到其中的一些结构。无监督学习适用于交易数据,例如,它可以识别具有相似属性的部分客户,然后在营销活动中可以类似地对待这些客户。

    或者它可以找到将客户群彼此分开的主要属性。

    流行的技术是:self-organizing maps, nearest-neighbor mapping, k-means clustering and singular value decomposition

    这些算法还用于分割文本主题、推荐项目和识别数据异常值。

    3.Semisupervised learning

    用于与监督学习相同的应用。但它同时使用标记和未标记的数据进行训练。

    这种类型的学习可以与分类、回归和预测等方法一起使用

    当与标记相关的成本太高而无法进行完全标记的训练过程时,半监督学习很有用。

    早期的例子包括识别网络摄像头上的人脸。

    4.Reinforcement learning
    常用于机器人、游戏和导航。
    通过强化学习,算法通过反复试验发现哪些动作会产生最大的回报。

    这种类型的学习具有三个主要组成部分:代理(学习者或决策者)、环境(代理与之交互的一切)和行动(代理可以做什么)。

    目标是让代理选择在给定时间内最大化预期奖励的动作。通过遵循良好的策略,代理将更快地达到目标。所以强化学习的目标是学习最好的策略。

    数据挖掘、机器学习和深度学习之间有什么区别?

    尽管所有这些方法都有相同的目标——提取可用于决策的洞察力、模式和关系,但他们有不同的方法和能力。

    数据挖掘

    数据挖掘可以被认为是从数据中提取洞察力的许多不同方法的超集,它可能涉及传统的统计方法和机器学习,数据挖掘应用来自许多不同领域的方法从数据中识别以前未知的模式,这可以包括统计算法、机器学习、文本分析、时间序列分析和其他分析领域。

    数据挖掘还包括数据存储和数据操作的研究和实践。

    机器学习

    与机器学习的主要区别在于,就像统计模型一样,其目标是理解数据的结构——将理论分布拟合到易于理解的数据中,因此,对于统计模型,模型背后有一个经过数学证明的理论,但这也要求数据满足某些强有力的假设。机器学习的发展基于使用计算机探测结构数据的能力,即使我们没有关于该结构是什么样子的理论。机器学习模型的测试是对新数据的验证错误,不是证明零假设的理论测试。由于机器学习通常使用迭代方法从数据中学习,因此学习可以轻松实现自动化。遍历数据直到找到一个健壮的模式。

    深度学习

    深度学习结合了计算能力的进步和特殊类型的神经网络来学习大量数据中的复杂模式。

    深度学习是当前最先进的图像识别和语音识别的技术。研究人员现在正在寻求将模式识别中的这些成功应用到更复杂的任务中,例如自动语言翻译、医学诊断和许多其他重要的社会和商业问题。

    相关文章

      网友评论

          本文标题:机器学习

          本文链接:https://www.haomeiwen.com/subject/hyndiltx.html