总的来说,最近还是没有什么码字的心情,所以这个文章总体来说就是一个备忘。
什么变化?
最近几年,人工智能在Transformer方面的成果,以“算力压制”的效果,以结果、效果直接颠覆了很多基于知识学习、规则学习时代的智能规则。
其中对于之前我提出的一些难题,也有了更多的破解的可能性。
前情回顾
2017年,算起来是7年前,写了一篇文章,[《外一篇 人工智能与基因工程》](https://www.jianshu.com/p/2e194f76aee7),其中提到了人类基因信息的特点,其类似于《天书》的结构中,对于文字与语意的研究,提出了语意与文字、声音之间,存在非常多的结构问题。
这种结构问题、关键字词问题,在之前的规则学习、深度学习的人工智能技术阶段,是非常难处理的一件事情。
新的时代
但是,Transformer模型以及GPT的能力,让我们看到“通过信息表象理解含义”这件事情有了比较大的进步。
Transformer模型以及GPT,基于对海量文字的学习,形成了对语意的理解,并且在理解语意的基础上,能够生成符合预期的文字表达。这种为什么会生成这样一句话的详细规则,是人类无法理解的。
那么扩展到基因领域。之前提到了:
曾经的历史上,有过人把人类基因普,比喻成为:“记载人类遗传信息的’天书’”。
这篇“天书”的主要结构,是DNA,组成DNA的主要结构是四种脱氧核苷酸(dAMP、dTMP、dCMP、dGMP)。
类比到我们所熟悉的环境中:
一个细胞核内的所有染色体,就是一套记录个人信息的“书”。
每一条染色体,就是一本自成体系的“书”。
而这本书的文档类型不是Word、不是Excel,是DNA。
这本书中的字,由四个笔画横竖撇捺(dAMP、dTMP、dCMP、dGMP)。”
展望
Transformer模型,基于强大的参数和算力,通过“阅读”大量的文字,能够理解语意。
那么,通过“阅读”大量的基因图谱,能够理解基因含义。
现在是否已经有人收集了大量的基因图谱,开展这种训练?
感觉不需要多久的将来,很可能有一场生物攻击……
Wollaston
2024年4月20日
于 连云港
网友评论