上一篇我们说到chatgpt,简单体验了其模型的基本能力,介绍了其基本原理和所开放的能力(api)。然,有反馈:似乎并不过瘾。这下有点“骑虎难下”了,若要细说chatgpt能玩出的花样,那可太多了。不管是精通编程的程序员还是普通不懂IT的小白,各取所需都是可以用得上它的。小马若是要展开细说,那可真是一发不可收拾了。本篇为前篇的续篇,小马简单概述下chatgpt能怎么玩,不作为本块的重点,后面有机会的话再展开细说。
如果说LLMs是AI的2.0时代,那么AI的应用应该算是AI的3.0时代,比如最近很火的AI Agent,是继大语言模型后又一个爆火的概念,是目前学术和工业界在人工智能领域的核心探索方向之一。这一概念早已有之,但大语言模型的出现大大增加了实现AI Agent的可能性,预示着3.0时代的狂飙期已经到来。比如auto-gpt、modelScope-Agent、 langchain agent等,程序员可以基于它们实现各种符合各自业务场景的决策机器人,未来智能终端交互方式不再是人和设备、人和屏幕的交互,而变成人与AI终端的交互。没有键盘,没有屏幕,你只需要说一句话AI就帮你把任务完成了。比如你要订一张机票,你只需要告诉AI你的目的地时间等需求,AI自动就会分解任务,比如先用工具查找再筛选再下单支付,直接就把任务完成了。而如果把AI比作电,那么空调、电视就是AI Agent,LLMs可以被认为是发电的基础之一,而chatgpt就是属于LLMs的一种。当然上面提到的chatgpt均可以被替换成任何开源或非开源的大模型,只要它们能力匹配就能任意互相替换,所以未来始终充满着无限可能。比如ChatGLM2-6B+FreeVC(克隆音频+SadTalker(单图像说话人脸动画)实现AI歌手数字人,声音克隆、视频对话、让图片说话;Qwen-7B-Chat+SDXL+I2VGen-XL+MusicGen能实现AI制作视频,只需要描述一个需求,脚本和素材等都是AI完成,几乎就是一个无中生有的过程;so-vits-svc模型的AI翻唱(AI孙燕姿);chatgpt与办公软件的集成可以直接让AI生成PPT等。
简单感受下科大讯飞将AI结合到产品的案例。
研发人员只需要知道目前模型的基本能力,就能结合需求场景自由组合实现AI赋能,玩出不一样的烟火。而有的小伙伴说了,我不是程序员不懂编程,那么手动结合也是可以做很多事情的。比如chatgpt结合Midjourney来绘图,没学过绘画照样也能画出符合需求的图片;ChatGPT(对话文案)+Midjourney(垫图生成数字人头像)+D-ID(数字人口播视频)+Filmora(剪辑)+剪映 结合完成数字人视频的剪辑与出片;5分钟利用ChatGPT4结合剪映快速制作短视频,ChatGPT4负责生成短视频脚本,剪映负责一键成片;chatgpt配合Mindshow使用可以AI生成PPT、流程图等,办公效率加倍;最简单的就是直接让chatgpt给我们秒写文章,做自媒体内容输出。“如何利用chatgpt赚钱变现”这类教程网络上已然琳琅满目。需要提出的一点是,最好能熟悉一下prompt提示词工程,这门学问不需要什么编程基础,但能助你在使用大模型的时候事半功倍,而且国外甚至已经有了这门知识的专门职位,月薪不菲。
为方便大家理解,小马整理了目前市面大模型普遍具备的基本能力汇总供参考:文本内容创作、问答对话、语言理解、长文本内容理解、文本语义相似度搜索、角色扮演、语音转文本、语音识别、文生图、图片识别、在线检索、数学与逻辑推理、代码生成、指令跟随、图生图、声音克隆、模型微调等。
即上面的这些基本能力都可以用来直接提供服务或者通过集成、结合来提供服务。不同模型之间能力可能有些许差异,大家选择模型时核对好模型能力即可。
最后来看两张最近网络上流行的调侃图片。
这使我我想起了网络上经典的一句话:人工智能不会取代人,只会淘汰那些不会使用人工智能的人。
AI是否会带来失业潮?业内人士表示,不必过度恐慌,生产力的提升会淘汰原先落后的模式,但也必然会产生匹配新生产力的新职位。
那么未来哪些职业将会被AI所取代呢?
网友评论