数据标注

作者: YIPXC | 来源:发表于2018-11-13 08:45 被阅读0次

背景

• 机器学习的学习方式包括:监督学习、无监督学习

• 数据分为两种类型:被标注or未被标注

• 其中监督学习需要经过标注的数据作为先验经验,即算法同事使用被标注的数据去训练模型

• 跟成熟的传统互联网领域不同,目前是AI早期阶段,在某些角度上,数据的重要性甚至超过了技术架构/算法,或常规的产品体验

流程

• 数据标注

○ 明确标注任务的目的,根据任务目的设立标签类别和维度

○ 标签设计原则:独立性、全面性

○ 标签颗粒度:颗粒度↑,独立性↓,全面性↑;颗粒度↓,独立性↑,全面性↓

• 模型训练

由算法同事跟进,但产品可依据需求,向算法同事提出需要注意的方面,避免无目的性、无针对性、无紧急程度的工作

• 模型测试

由测试同事/算法同事将未被训练过的数据在新的模型下做测试。

测试同事需要将测试的结果完善地反馈给算法同事,算法同事才能找准模型效果欠缺的原因。同时,测试同事将本次模型的指标结果反馈给产品,由产品评估是否满足上线需求。

一般来说模型测试至少需要关注两个指标:

1.精确率:识别为正确的样本数/识别出来的样本数

2.召回率:识别为正确的样本数/所有样本中正确的数

• 产品评估

在模型上线之前,产品需反复验证模型效果

相关文章

  • 数据标注

    背景 • 机器学习的学习方式包括:监督学习、无监督学习 • 数据分为两种类型:被标注or未被标注 •其中监督学习需...

  • 医学数据管理工作介绍

    一、医学数据标注主要类型 医学数据管理主要工作有医学数据标注和医学知识搜集整理,为产品做医学数据支持。 需要标注的...

  • 【Tool】工作学习中常用的工具软件

    编辑器 如何快速上手vim 数据标注工具 深度学习辅助数据标注

  • CH1 统计学习方法概论|1.9标注问题《统计学习方法》-学习笔

    文章原创,最近更新:2018-06-20 1.什么是数据标注2.常见的几种数据标注类型3.数据标注的过程4.数据标...

  • 谈谈人工智能数据标注那些事儿

    一、什么是数据标注 首先谈谈什么是数据标注。数据标注有许多类型,如分类、画框、注释、标记等等,我们会在下面详谈。要...

  • 视频数据标注工具与平台(数据标注公司)

    最近在做相关项目,评估了多个数据标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考。 视频数据标注平台...

  • AI训练师

    背景 • 获得原始数据后,由AI PM先用相关工具简单处理,再交付给数据标注人员进行标注,但标注人员对数据的理解和...

  • [Java]注解

    @Resource 标注资源 @Controller 用于标注控制层组件 @Repository用于标注数据访问组...

  • 分享:数据标注质量如何把控

    AI企业对数据标注的质量要求是非常高的,而AI企业在寻找数据标注服务的过程中,数据标注质量差成为了AI企业最为苦恼...

  • 数据标注工作简介

    工作流程拆解 一、数据标注 1、三个角色 1)标注员:标注员负责标记数据 2)审核员:审核员负责审核被标记数据的质...

网友评论

    本文标题:数据标注

    本文链接:https://www.haomeiwen.com/subject/eoqkfqtx.html