近期一款名为“GPT-4”的人工智能聊天机器人迅速走红,这一款人工智能聊天机器人几乎能像人一样来聊天,你问什么它都能给出准确的答复,甚至能帮你改代码,可以帮你原创论文等,以至于很多学生都开始关注它,那么这么强大的“GPT-4”,它背后的“大佬”是谁呢?现在就让我来给你讲讲你比GPT-4更NB,它背后的公司——OpenAI
OpenAI的发展历程
OpenAI旗下的AI产品
达尔·E
达尔·E于2021年2月发布,达尔·E从文本创建图像,达尔·E是12亿个参数版本的GPT-3经过训练,可以使用文本-图像对的数据集从文本描述生成图像。
我们发现它具有多种功能,包括创建动物和物体的拟人化版本,以合理的方式组合不相关的概念,渲染文本以及对现有图像应用转换,像GPT-3一样,达尔·E 是一个转换器语言模型,它将文本和图像作为包含多达 1280 个令牌的单个数据流接收,并使用最大可能性进行训练,以一个接一个地生成所有令牌,达尔·E能够为探索语言构成结构的各种句子创建合理的图像。
1. 控制属性
达尔·E 可以以多边形形状呈现熟悉的对象,这些形状有时在现实世界中不太可能出现;可以将各种植物,动物和其他物体的纹理映射到三维实体上。
2. 绘制多个对象
达尔·E 正确响应某些类型的相对位置,但不能正确响应其他类型的相对位置,而达尔·E 确实对少量对象的属性和位置提供了一定程度的可控性,成功率可能取决于标题的措辞方式。
3. 可视化透视和三维
达尔·E 还允许控制场景的视点和渲染场景的3D样式,达尔·E可以在各种不同的视图中绘制每种动物,通常能够根据所选的3D样式修改每个动物的表面,为了进一步推动这一点,DALL·E能够从一系列等距的角度在每个角度重复绘制一个知名人物的头部,并发现我们可以恢复旋转头部的平滑动画。
我们提示达尔·E 带有描述知名人物的标题和显示以特定角度绘制的帽子的图像的顶部区域。然后,我们问达尔·E 以完成给定此上下文信息的图像的其余部分。我们反复这样做,每次将帽子旋转几度,发现我们能够恢复几个知名人物的流畅动画,每一帧都尊重角度和环境照明的精确规范。
4. 可视化内部和外部结构
达尔·E能够绘制几种不同类型对象的细粒度外部细节。这些细节只有在近距离观察物体时才会显现出来。
5. 动物插图
达尔·E 将将人体部位适应动物。例如,当被要求画萝卜擤鼻涕、喝拿铁或骑独轮车时,DALL·E经常在合理的位置画头巾,手和脚。
6. 达尔·E还有很多功能在此就不一一列举
DALL·E2
于2022年4月6日发布新的人工智能系统DALL·E2,达尔·E2是一个人工智能系统,可以从自然语言的描述中创建逼真的图像和艺术,它可以组合概念、属性和样式,可以将图像扩展到原始画布之外,从而创建广阔的新构图。
当然比较每个模型时,达尔·E2优于达尔·E1。
ChatGPT
ChatGPT于2022年11月30日发布,是一种对话式 AI,可以与您聊天、回答后续问题并挑战不正确的假设。
GPT-4
GPT-4于2023年3月14日发布,GPT-4,这是OpenAI在扩展深度学习方面的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。
视觉输入
GPT-4 可以接受文本和图像的提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。具体来说,它生成文本输出(自然语言、代码等),给定由穿插文本和图像组成的输入。在一系列域(包括包含文本和照片的文档、图表或屏幕截图)上,GPT-4 表现出与纯文本输入类似的功能。此外,它可以通过为纯文本语言模型开发的测试时技术进行增强,包括少数镜头和思维链促使。图像输入仍然是研究预览,不公开可用。
可操纵性
GPT-4用户可以通过在“系统”消息中描述这些方向来规定他们的 AI 风格和任务,而不是具有固定冗长、语气和风格的经典 ChatGPT 个性。系统消息允许 API 用户显著自定义其用户体验在范围内。
局限性
尽管具有功能,但GPT-4具有与早期GPT模型类似的限制。最重要的是,它仍然不完全可靠(它“幻觉”事实并犯推理错误)。
OpenAI布局的未来
OpenAI是一个非常有前途的人工智能研究机构,它在深度学习、自然语言处理、机器人等多个领域都取得了很好的成果。未来几年,OpenAI将继续发挥其在人工智能领域的领先地位,推动人工智能技术的发展和应用。
以下是OpenAI布局的未来可能性:
1. 推动人工智能技术的研究和发展。OpenAI将继续在深度学习、自然语言处理、机器人等领域进行研究,进一步提高人工智能技术的水平和应用范围。
2. 推进人工智能技术的商业化应用。OpenAI将积极探索人工智能技术在各个行业的商业化应用,为社会带来更多的价值。
3. 加强与大学、企业等合作。OpenAI将与各大高校、企业等建立更紧密的合作关系,共同推动人工智能技术的研究和应用。
4. 推动人工智能技术的普及和应用。OpenAI将积极宣传和普及人工智能技术,让更多人了解和应用这项技术,推动人工智能技术的发展和应用。
总而言之,OpenAI将继续投入大量的人力、物力和财力,推动人工智能技术的发展和应用,为人类带来更多的福利和改变。
ONE MORE THING
咪豆AI圈(Meedo)针对当前人工智能领域行业入门成本较高、碎片化信息严重、资源链接不足等痛点问题,致力于打造人工智能领域的全资源、深内容、广链接三位一体的在线科研社区平台,提供AI导航网、AI版知乎,AI知识树和AI圈子等服务,欢迎AI未来儿一起来探索。
网友评论