我叫吉恒杉,29岁,是一名“吻戏鉴定师”。
和女朋友刚谈恋爱的时候,我说我的工作是训练计算机识别出吻戏镜头。她听完觉得特别不可思议,谁能给钱让你干这个呢?
如果你用手机、电脑看过视频,一定感受过进度条上的情节提示,可以迅速找到自己想看的明星或情节。
没错,这些就是我们干的!
正经的,在优酷我们的岗位叫人工智能标注员。我每天训练机器识别“接吻”镜头,然后将成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。“吻戏鉴定师”是同事们的戏称,但说实话,我挺喜欢。
选择这个工作,一开始是因为和我的硕士专业计算机视觉刚好吻合。通俗地讲,就是“教电脑看懂世界”。现在我每天教电脑看懂“什么是接吻”,可以说,契合度百分百了。当然,这个工作既给大家带来快乐和幸福,又能以工作的名义看网剧(哈哈哈哈哈……这个可能是重点),最爱《军师联盟》,吴秀波铁粉。
做一名合格的人工智能标注员其实也不那么容易。身边越来越多的人用手机和电脑看视频,大家不仅是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。
要想实现搜索和智能编辑,还真需要不少“人工”。要给成百上千幅吻戏画面打上标签,先要探讨什么样的画面算是吻戏,制作模型应该怎么画,然后训练机器人识别什么场景是“接吻”,通过数次的技术调试,让机器人自动从海量视频中,迅速抓取场景。
因此如何教机器识别接吻成了首要的难题。我们要从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。
我们一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。
但是机器毕竟不是人,对有些复杂情况也无法识别。比如,有的接吻深情对视,而有的若即若离,团队里的伙伴们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。
“吻戏鉴定”还需要根据机器的反应进行繁琐的后期调试。机器学习上千幅图片中的特征,然后再给机器一张“接吻”的画面,它就能认出来了。
目前,我们团队已经为2万多条吻戏打上了标签,一条5分钟的视频处理可在10秒内完成。比如《三生三世十里桃花》,每集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。
现在我和团队的小伙伴们还开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,这样观众看视频时能很方便的去找到自己想看的情节。
当然在做标注的时候并不是每次都能成功,往往会因为一些小的差别,导致失败,重新再来。这就要求我们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。
我们就想用自己的一点点努力,让你们看剧的时候,更爽一些。
好了,不说了,我要去训练机器识别古力娜扎和迪丽热巴了。
本文作者:橙子
本文来自云栖社区合作伙伴“阿里味儿”,如需转载请联系原作者。
网友评论