数据标注,顾名思义,就是给数据打标签或者给数据做标记。它是数据清洗后的一道重要工序。
目前的人工智能算法由数据驱动,一个好的模型就需要质量优异的数据资源进行训练。数据又可以分为带标签数据和无标签数据(原始数据),而当前性能优良的算法以深度学习为代表的算法都需要海量带标签数据进行训练。因此,数据标注质量直接影响着模型性能,因此数据标注对于人工智能应用非常重要。
数据标注主要包括文本标注、图片标注、视频标注、关节点标注等。数据标注的基本数据类型包括文本、图片、视频、语音、数值型数据。其中,文本标注,根据文本长度可以分为短文本标注、篇章文本标注,应用于舆情监测、垃圾短信分类等领域。视频标注的数据主要应用于视频监控、人脸识别、自动驾驶等领域。其他的类型也有对应的应用场景。
目前社会上有众多的小型数据标注公司为一些大型的互联网公司提供数据标注外包服务,但整个数据标注行业仍在发展中。随着越来越多的大中专学生进入这个行业工作,数据标注正在成为一种新兴的高新就业岗位。
关注数据标注爱好者社区公众号获取更多内容
网友评论