美文网首页
你所不知道的AI进展

你所不知道的AI进展

作者: 泡菜鸡丁 | 来源:发表于2019-11-13 17:16 被阅读0次

    现在的人工智能这四个字可以说是随处可见,但大多数人还是可能觉得,离我甚远,跟普通人没多大关系。但实际上,AI突飞猛进,正在脱离实验室,进入了日常生活。仅仅是现在的技术水平,就足以模糊现实与虚拟的界限,颠覆一般民众的认知。

    一、图像处理

    人工智能最早是从图像处理开始的。图像处理事一种常见任务,智能要求比较高,需要使用Photoshop之类的软件人工编辑,一般都算法解决不了。

    1.1对象补全

    2017年,日本科学家提出了一种图像的对象补全模型。经过训练,模型可以补全图片上缺失的部分。

    1.2背景处理

    背景处理指的是,将前景物体从图片分离出来,再对背景进行加工。目前,已经有很好的智能算法可以去除图片背景。

    1.3样式转换

    人工智能还能够识别图片的风格样式(即像素的变化规律),将其套用在另一张图片。

    1.4图像着色

    一旦识别出图片中的物体,模型就可以统计不同物体的像素颜色规律,然后就能推断黑白照片可能的颜色,从而实现照片着色。

    二、GAN方法

    2.1简介

    GAN是"生成对抗网络(Generative)"的缩写,它是一种革命性的提升人工智能模型效果、生成虚拟图像的方法。

    原理很简单,就是两个神经网络互相对抗。一个神经网络负责生成虚拟图像,另一个神经网络负责鉴定假图像。理论上,如果GAN训练成功,那么生成的假图像与真图像将无法区分。2014年 这种方法提出以后,快速发展,目前效果可以乱真。

    GAN不仅能生成虚拟图像,还能生成音频、文本,甚至是化合物分子。AI模型可能创造出来的任何东西,都能使用GAN提升效果。GitHub有一个仓库,专门收集不同用途的GAN,目前已经有了500多种。

    2.2StyleGAN

    目前,生成虚拟人像效果最好的模型是Nvidia公司的StyleGAN。

    2.3图像翻译

    一种图像通过GAN转变为另一个图像,称为图像翻译。空拍照片变成地图、黑白照片变成彩色照片,都是图像翻译的例子。

    pix2pix是图像翻译的开源工具,它可以让黑夜变成白天,示意图变成实物图。

    图像翻译的难点在于,它需要有成对的示例(源图像和相应的目标图像),告诉模型应该怎么翻译,这些示例可能是很难创建。但是反过来,只要有配对的示例,就可以翻译图像,不管这种翻译是否合理。

    CycleGAN模型还支持跨域翻译,将照片翻译成油画,斑马翻译成马。

    相关文章

      网友评论

          本文标题:你所不知道的AI进展

          本文链接:https://www.haomeiwen.com/subject/zbkkictx.html