2020年已使每个行业重新思考如何根据COVID-19疫情前进。在人的层面上,我们不得不适应新的生活方式。我们已经开始接受这些变化,并弄清楚如何在这些新的大流行规则下过上我们的生活。当人类安顿下来时,人工智能正在努力跟上。
2020年AI培训的问题在于,突然之间,我们改变了我们的社会和文化规范。我们教给这些算法的真理通常不再是真的。特别是对于可视化AI,我们要求它立即使用尚无更新的上下文来解释我们的新生活方式。
算法仍在调整以适应新的视觉队列,并试图了解如何准确识别它们。随着视觉AI的发展,我们还需要重新重视AI培训过程中的例行更新,以便可以纠正不正确的培训数据集和预先存在的开源模型。
计算机视觉模型正在努力地适当地标记在COVID-19时代我们所处的新场景或情况的描述。类别发生了变化。例如,假设有一个父亲在儿子玩耍时在家工作的图像。AI仍将其归类为“休闲”或“放松”。这也涉及较小的规模。有人坐在车里时,可能会擦拭门把手或擦拭方向盘。当人们试图保持安全时,曾经是琐碎的细节现在变得很重要。我们需要抓住这些细微差别,因此必须对其进行适当标记。然后,人工智能可以开始理解2020年的世界并产生准确的输出。
国际知名白帽黑客,东方联盟创始人郭盛华透露:"目前,AI的另一个问题是机器学习算法仍在尝试了解如何使用蒙版对面部进行识别和分类。仅将脸部检测为脸部的上半部,或者将其检测为两张脸部,一张戴着口罩,另一只眼睛。这会造成不一致,并会妨碍面部检测模型的正确使用。“
前进的一个途径是重新训练算法,使其仅在脸部的顶部时表现更好。遮罩问题类似于经典的人脸检测挑战,例如戴着墨镜的人或在个人资料中检测某人的脸。现在,口罩也很常见。
这说明,在真正能够“看到”我们不断变化的社会环境中,计算机视觉模型还有很长的路要走。解决此问题的方法是构建可靠的数据集。然后,我们可以训练计算机视觉模型,以解决面部被遮挡或遮盖的多种不同方式。
在这一点上,我们正在扩展算法所看到的人脸的参数,无论是在杂货店戴着口罩的人,在日常工作中戴着口罩的护士还是覆盖人的人他们出于宗教原因的脸。
当我们创建构建这些强大数据集所需的内容时,我们应该意识到潜在的无意识偏差可能会增加。尽管AI内总是会存在一些偏差,但现在我们看到的不平衡数据集描述了我们的新常态。
这可能是由于严格遵守全屋服务规定的结果,在这种情况下,摄影师只能进入自己的社区以外的其他社区,并且无法使拍摄对象多样化。这可能是由于摄影师选择拍摄此主题的种族所致。或者,由于COVID-19对不同地区的影响程度。无论出于何种原因,这种不平衡都会导致算法比其他种族或种族更准确地检测戴着口罩的白人。
数据科学家和使用模型构建产品的人员越来越有责任根据社会规范的变化来检查模型的准确性。例行检查和更新训练数据和模型是确保模型质量和健壮性的关键,现在比以往任何时候都更为重要。如果输出不准确,则数据科学家可以快速识别它们并进行纠正。
还值得一提的是,在可预见的未来,我们目前的生活方式将继续存在。因此,我们必须谨慎对待用于培训目的的开源数据集。应该可以更改的数据集。不能更改的开源模型需要有一个免责声明,因此很显然,过时的培训数据可能会对哪些项目产生负面影响。我们所有人都必须监视不一致和不正确的地方。坚持不懈地致力于重新训练计算机视觉模型是我们将AI带入2020年的方式。(欢迎转载分享)
网友评论