来源:CPDA数据分析师网 / 作者:数据君 /
趋势1:企业认识到小数据的美
在2021年我们将看到企业从从大数据学习过渡到从小数据学习,最近有两篇文章引起了这一趋势的关注,一种根本性的新技术可以使AI在几乎没有数据的情况下进行学习麻省理工学院技术评论和小数据可以在AI中发挥重要作用,在激动人心的大数据对人工智能的潜力之后,为什么我们现在专注于从小数据中学习?小数据比大数据存在我们的时间更长。公司意识到从大数据中学习是昂贵且费时的,机器和深度学习需要许多示例,许多小时的数据标记以及大量训练和调整模型的工作。

用人工标记大量数据不仅劳动强度大,而且容易出错,从而影响结果的准确性
人类不会以这种方式学习,我们仅从一两个示例中学习,一个人只需要看一次酒杯和咖啡杯就可以知道两者之间的区别,机器需要成千上万个酒杯和咖啡杯的例子来加以区分,人类的进化优势是可以快速学习如何区分物体并立即在“战斗还是逃跑”情况下做出决定的大脑,我们需要设计以这种方式学习的算法来扩展AI的采用。
许多公司没有大量的历史数据来训练机器
精益生产商的价格运行,这意味着百万分之一的缺陷,如此低的缺陷率无法为机器学习提供足够的实例。如果机器可以从一个样本中学习,那将更加实用和更具成本效益。
趋势2:远程监控变得流行
远程监控技术已经存在了一段时间,但由于COVID-19,临界点出现在2020年,随着社会试图最大程度地减少对COVID-19的接触,越来越多的工作正在远程进行,在节省成本的驱动下,我们已经看到了朝着机器人过程自动化的巨大步伐,但是远程监视是不同的,这是必要的,因为最终的决策者仍然是人,远程监控可应用于从能源生产到患者诊断和监控的所有行业。启用远程监视取决于数据和分析,例如要大规模地进行远程有心患者的诊断和监测,我们需要授权接受过了解心跳训练但没有经过数据科学训练的医学专业人员来分析和配置每位患者可穿戴设备上的个性化预测模型。
这种趋势与从小数据中学习的第一种趋势紧密相关。每个患者的心跳模式都是唯一的,这意味着每个患者都是其中一个的样本,而预测性监视模型对于每个患者都是唯一的,医生如何在可穿戴设备的配置过程中利用很小的心跳样本来实现高度精确的个性化人工逻辑网络,可以预测并警告医生有关患者病情的任何恶化。
趋势3:详细的时间序列数据变得越来越重要
安装了如此多的传感器,难怪时间序列数据如此迅速地增长,一些分析师估计,公司收集的粒度数据比业务数据多9倍,随着5G的到来,通过高速网络实时交付的细粒度数据为智能制造,数字健康,高频交易系统等领域创造了机遇,粒度数据非常重要,因为它具有诊断性,可让我们立即发现问题,预测未来事件,自动化决策并触发即时行动,例如如果您以一秒为增量监视患者的脉搏,则不会看到心脏病发作,但是如果您监视180毫秒,心脏病发作的形状对于人眼来说变得很明显,此类心跳是由监视当今工业机器和过程,车辆引擎和电池的设备产生的,但由于无法分析如此大量的粒度数据而未被充分利用,能够找到有趣的模式并为其赋予意义就像找到金块,获利的机会是无止境的,因为有意义的模式会触发即时行动,从而挽救生命,防止机器故障并利用市场机会。
一旦检测到,便可以立即获利
如今,公司正在寻找新型分析平台和算法,以提取此类黄金块,建立已知模式的库并进行实时监控,因此在这一领域中出现了具有新分析方法的新平台,已成为领域专家和业务分析师掌握的必不可少的新工具。
网友评论