2022年底OpenAI发布了语言大模型chatgpt3.5,它能像人一样跟我们聊天,从此AI市场着了大火,国内外各个顶级科技公司纷纷跟进,出现了一大批的AI大模型,比如文心一言(百度)、Gemini(谷歌)、通义千问(阿里)、讯飞火星(科大讯飞)、豆包(抖音)、kimi(月之暗面)等等,这一年可以称得上是AI元年,AI真正参与到了普通人的工作和生活,未来属于擅长利用AI的人类。
但大部人对AI大模型的理解是:我们只是用户,搞这东西需要很高的技术难度和巨大的投资。
非也!非也!AI大模型恰恰为普通开发者打开了传统上难以涉足领域的大门,比如语音和图像识别、推荐、智能对话、内容审核等等。
我们要始终坚信:科技的发展会让复杂的世界变得更加简单!!
从目前大模型相关工作来看:AI大模型的研发有相当难度和较高投入,这部分可以叫做AI基座,各个顶尖科技公司在这个区域逐鹿;但是AI大模型的应用非常简单,只需要几个简单的API调用,我们便能够用这些大模型的能力构建满满科技感的AI应用,这是广大普通开发者和小公司的时代机会。
接下来我们就来谈谈怎么做一个AI应用
做AI应用最重要的是什么?了解什么是AI,知道TA能做什么!!
AI是Artificial intelligence 人工智能的缩写,顾名思义,这个技术创立之初的目标就是来代替人类做脑力工作的,特别是目前大模型出来后,你可以认为 人类能做什么,AI就能做什么:比如你能和小朋友聊天,讲笑话、讲历史、AI可以;比如你能够主持一个会议,记录会议重点,给出会议总结,AI可以;比如你能根据你看的,听到的确认一个人是谁,如果是熟人就去打招呼,聊聊近况,AI可以;总之,AI原则上目前可以做到任何事情,实际上目前AI可以做的事情依赖市场和创业者的想象力。
目前来说AI的能力大致相当于各个领域排行前10%-20%的专业人员,未来在人类已知的工作生活中,围绕AI可以把人类分为三种:探索者、使用者、边缘者,未来我们需要积极拥抱AI,把TA当作超级助手-贾维斯,我们负责想象,制定原则,TA负责执行,在一起,搅动这个时代的风云~~
回到现状,我们怎么使用AI大模型的具体能力呢?
前文讲到,AI就是我们的超级人类助手,当我们给TA安排任务的时候,按照什么样的套路才能讲的清楚呢?一般来要说清楚这几个问题:事情背景是什么?要做什么?有什么要求?以什么形式汇报? 当我们给AI下达任务,也需要说清楚这些,这就是 prompt,以这种方式给AI下达任务,TA才能更加出色的完成。
接下来是一个示例-基于文心一言做的场景推荐:
一、创建一个应用
这个相当于文心一言给这个用户的一个账号密码,有这个账号密码才能访问文心的API,文心一言也是基于这个账号进行收费。
开通付费可以根据这些文档介绍,看你需要什么能力,因为我只需要对话能力 所以购买了文心4.0服务。
三、进行token获取以及对话API调用
1. 获取token 不管你是服务端、前端、App都可以,基本就是基于刚才你创建应用的参数获取这个token
对话API 从这个文档看,对话API就两个入参,access_token上一步获取的,另一个就是你的问题,如果是一次问题就只有角色user的content;多轮对话,每次要把上一次AI回答也要附加上。
看!就是这么简单!现在你已经可以通过简单的两个API调用完成和大模型对话了!
接下来,我们讨论下如何在对话API调用的时候如何加上自己的要求,就是想办法把你的要求(prompt)组装到user的content中,例如,可以根据用户输入 +你的prompt 就输出user content:
content组装
这时候你已经完成了一个基于AI大模型的音视频推荐功能,TA能够基于你的场景,推荐你喜欢的音视频的名称,并以JSON形式下给发调用方,调用方拿到名称再去相关的资源方检索就OK了,大概返回如下:
推荐
这种方式是直接通过API调用,自己需要用上端上的网络请求库,跟自己应用其他API没有什么不同,当然你也可以直接使用文心提供的各个平台的SDK进行这个API请求。
总结下:当前大模型的能力使用对我们来说就是付费的API调用。
相信不久的将来,当终端上也有完善的AI能力,你有一个需求,只要清晰明白的告诉手机、电脑等终端设备,内置的AI大模型就能够自动帮你写好程序,并把程序当作数据一样保存下来供你使用,或者分享给他人,那时候就会实现 人人都是程序员。大家可以思考下,那个时候我们人的核心竞争力是什么呢?
网友评论