先说结论,有前景,但也面临很多挑战,如何做呢,结合挑战,会分为中文语料、资金、团队等两大方面。
一、中文语言模型训练
目前Chatgpt(以下简称:CG) 对中文的支持到底怎么样?
有人分析CG支持中文,但没有在特别多的中文语料上去做训练,它很多的知识、表达,都是通过英文的训练文本学到。
比如,他问CG:怎样能赚到一个小目标?这个问题在中文互联网的语境里面,大家都知道,一个小目标是王金林指的说的一个亿,但是CG给的回答,能看出机器不知道一个小目标是什么意思,所以推断是CG在训练的时候并没有用很多的中文互联网的语料。
不管是打造中国的CG,还是中国的Open Ai,首先要把中文的语言模型训练好,把中文互联网上所有的语料用好,才能做更好的、更懂中国人、更懂中文的语言模型。
如果打造CG的商业模式或者 Open AI 的商业模式,可能就要面向中国的市场和商业模式,因为这是美国的公司做不到或者不擅长的。
单从算法方面来说,CG上的一些技术,我们可以做到。比如,其中他们大规模在用的强化学习技术,大规模地去用,大家多少在原来也知道这个技术。
中国怎么来打造Open AI,我们现在的企业总体上气氛还是有点急功近利。当然,也需要资本的投入非常大,以及一些创作机制。
综上,打造中国的Open AI,需要有好的中文语言训练模型、足够多的钱、足够专业和专注的团队。
网友评论