数据标注是通过数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。
也许这么说仍然会有很多人不理解什么是数据标注,举个简单的例子,我们在聊天软件中,通常会有一个语音转文本的功能,这种功能的实现大多数人可能都会知道是由智能算法实现的,但是很少有人会想,算法为什么能够识别这些语音呢,算法是如何变得如此智能的。其实智能算法就像人的大脑一样,它需要进行学习,通过学习后它才能够对特定数据进行处理,反馈。正如语音的识别,模型算法最初是无法直接识别语音内容的,而是经过人工对语音内容进行文本转录,将算法无法理解的语音内容转化成容易识别的文本内容,然后算法模型通过被转录后的文本内容进行识别并与相应的音频进行逻辑关联。也许会有人问,那么不同的语速、音色模型算法怎么能够分辨呢。这就是为什么模型算法在学习时需要海量数据的原因,这些数据必须覆盖常用语言场景、语速、音色等,全面的数据才能训练出出色的模型算法。语音标注的过程如下图示,便于理解。
图像标注和视频标注按照数据标注的工作内容来分类的话其实可以统一称为图像标注,因为视频也是有图像连续播放组成的(大家都知道1秒钟的视频包含25帧图像,每1帧都是1张图像)。现实应用场景中,常常应用到图像数据标注的有人脸识别以及自动驾驶车辆识别等。就拿自动驾驶来说,汽车在自动行驶的时候如何识别车辆、行人、障碍物、绿化带、甚至是天空呢?图像标注不同于语音标注,因为图像包括形态、目标点、结构划分,仅凭文字进行标记是无法满足数据需求的,所以,图形的数据标注需要相对复杂的过程,数据标注人员需要对不同的目标标记物用不同的颜色进行轮廓标记,然后对相应的轮廓打标签,用标签来概述轮廓内的内容。以便让模型能够识别图像的不同标记物。图像标记的示例如下图所示:
再来说文本标注,文本标注与之相关的现实应用场景包括名片自动识别、证照识别等。文本标注和语音标注有些相似,都需要通过人工识别转录成文本的方式。文本标记的示例如下图所示:
网友评论