美文网首页阿里云我是程序员机器学习
报告老板!这个阿里程序员每天上班就看别人接吻

报告老板!这个阿里程序员每天上班就看别人接吻

作者: 阿里云云栖号 | 来源:发表于2018-08-14 16:35 被阅读900次

    我叫吉恒杉,29岁,是一名“吻戏鉴定师”。

    和女朋友刚谈恋爱的时候,我说我的工作是训练计算机识别出吻戏镜头。她听完觉得特别不可思议,谁能给钱让你干这个呢?

    如果你用手机、电脑看过视频,一定感受过进度条上的情节提示,可以迅速找到自己想看的明星或情节。

    没错,这些就是我们干的!

    正经的,在优酷我们的岗位叫人工智能标注员。我每天训练机器识别“接吻”镜头,然后将成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。“吻戏鉴定师”是同事们的戏称,但说实话,我挺喜欢。

    选择这个工作,一开始是因为和我的硕士专业计算机视觉刚好吻合。通俗地讲,就是“教电脑看懂世界”。现在我每天教电脑看懂“什么是接吻”,可以说,契合度百分百了。当然,这个工作既给大家带来快乐和幸福,又能以工作的名义看网剧(哈哈哈哈哈……这个可能是重点),最爱《军师联盟》,吴秀波铁粉。

    做一名合格的人工智能标注员其实也不那么容易。身边越来越多的人用手机和电脑看视频,大家不仅是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。

    要想实现搜索和智能编辑,还真需要不少“人工”。要给成百上千幅吻戏画面打上标签,先要探讨什么样的画面算是吻戏,制作模型应该怎么画,然后训练机器人识别什么场景是“接吻”,通过数次的技术调试,让机器人自动从海量视频中,迅速抓取场景。

    因此如何教机器识别接吻成了首要的难题。我们要从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。

    我们一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

    但是机器毕竟不是人,对有些复杂情况也无法识别。比如,有的接吻深情对视,而有的若即若离,团队里的伙伴们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

    “吻戏鉴定”还需要根据机器的反应进行繁琐的后期调试。机器学习上千幅图片中的特征,然后再给机器一张“接吻”的画面,它就能认出来了。

    目前,我们团队已经为2万多条吻戏打上了标签,一条5分钟的视频处理可在10秒内完成。比如《三生三世十里桃花》,每集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

    现在我和团队的小伙伴们还开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,这样观众看视频时能很方便的去找到自己想看的情节。

    当然在做标注的时候并不是每次都能成功,往往会因为一些小的差别,导致失败,重新再来。这就要求我们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。

    我们就想用自己的一点点努力,让你们看剧的时候,更爽一些。

    好了,不说了,我要去训练机器识别古力娜扎和迪丽热巴了。

    本文作者:橙子

    阅读原文

    本文来自云栖社区合作伙伴“阿里味儿”,如需转载请联系原作者。

    相关文章

      网友评论

      • 7633d60bf9ec:数据标注我知道,根据算法,标注信息,所谓的AI不过是大数据。----------------------微信小程序→搜索“办公鱼”,办公文具、生活用品一站式采购,个人文具、生活用品,种类多,价格实惠到不敢相信
      • f0b6684b2b62:但是机器毕竟不是人,对有些复杂情况也无法识别。
      • 5592b7de7d9a:什么时候来个露胸提醒
      • 云启LAB少儿编程:什么时候能有影片分级提醒?😂
      • 来峰:什么时候能有影片分级提醒?😂
      • ed8765a477c3:《断臂山》这种能训练吗?
        阿里云技术:@LKNB 不能

      本文标题:报告老板!这个阿里程序员每天上班就看别人接吻

      本文链接:https://www.haomeiwen.com/subject/tthvbftx.html