AI数据采集与标注

作者: 宁静消失何如 | 来源:发表于2021-01-11 11:20 被阅读0次

AI数据采集与标注
分享：数据标注质量如何把控
专访龙猫数据CTO姚毅：为AI企业提供精准数据服务
AI训练师
艾佳生活-数据标注
AI-数据标注
AI+AR，为智能移动GIS应用提供更多可能
地图（位置）数据现场采集工具（移动端）
AI智慧医疗
AI-数据标注类型

AI数据采集与标注

机器学习分两种：监督学习和无监督学习

监督学习：

给定的训练数据集中学习出一个函数（模型参数），当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类

无监督学习

输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类（聚类，clustering）试图使类内差距最小化，类间差距最大化。通俗点将就是实际应用中，不少情况下无法预先知道样本的标签，也就是说没有训练样本对应的类别，因而只能从原先没有样本标签的样本集开始学习分类器设计。

非监督学习目标不是告诉计算机怎么做，而是让它（计算机）自己去学习怎样做事情。非监督学习有两种思路。第一种思路是在指导Agent时不为其指定明确分类，而是在成功时，采用某种形式的激励制度。需要注意的是，这类训练通常会置于决策问题的框架里，因为它的目标不是为了产生一个分类系统，而是做出最大回报的决定，这种思路很好的概括了现实世界，agent可以对正确的行为做出激励，而对错误行为做出惩罚。