一种视觉生成模型,数据高效型训练,并破解了基于文本的验证码
摘要:
从少数的例子中学习,并概括到显著不同的情况,是人类视觉智能的能力,但是这些能力还没有先进的机器学习模型能够匹敌。 通过从系统神经科学中汲取的灵感,我们引入了一种基于消息传递的推理的概率生成模型,模型以统一的方式处理识别,分割和推理。 该模型表现出极佳的泛化和遮挡推理能力,在具有挑战性的场景文本识别基准测试中胜过深度神经网络,同时数据效率高出300倍。 另外,该模型基本上在没有特别的验证码启发的情况下,通过生成分割字符来打破现代基于文本的验证码防御。 我们的模型强调数据效率和组合性等方面,这些在走向通用的人工智能的道路上可能是很重要的部分。
网友评论