视觉是如何产生的呢?比如说红色,为什么你一看到这种“红色”你就知道它是红色呢?我想这很好玩。
人的眼睛可以对光波产生刺激,假设红色是a01光波(编号),绿色是a02光波,我们忽略眼睛接受光波的过程,简单地理解成刺激,那么眼睛在第一次受到“红色”光波的刺激时,会记住这个光波的编号a01,下次再受到“红色”刺激时,就会知道又是这个a01光波,直到有一天,书上说这种大家都能看到的a01光波有个名字:红色,于是产生了连接,a01就是红色。于是以后再看到这种光波的时候,很自然地就定义它是红色,所以人类学会了第一种颜色。
这里面的微妙过程是:特定光波刺激--〉眼睛处理成特殊的信号(类似于a01)-〉记住这种信号--〉再看到时马上作出反应,这个见过--〉知道了这个信号是红色--〉再见时知道这是一种颜色红色,同时以后都认识这种颜色,自然地叫它红色。
眼睛的作用-光信号转电信号在这里,我觉得这种视觉形成与记忆原理是最可靠的。例如大脑如果能反向记忆,那么想起红色时,就是a01光波,就是那种红色。如果你不信,那你跟我玩个游戏。现在,你闭上眼睛,想一想红色是怎样的?是不是描述不出来,因为你记忆的是电信号a01,所以你想不出来那种红色的光信号,只是模糊地知道红色这种东西,因为你可以从红色推到a01,但却到不了光信号;然后,你看一下红色的东西,是不是马上知道这是红颜色,因为光信号被眼睛变成了大脑能记忆的电信号,然后根据你以前的学习经验知道这是红色。是不是很神奇。所以,通过图像识别的特征提取技术来复制眼睛不是很好,特征识别确实可以区分东西,但你该怎么记住这种东西?正方形,圆形确实可以区分,红色,绿色呢?是不是想说,正方形是实体,看得见摸得着,而红色是抽象概念。这就和语言是一样的,一边能做的叫做做事,另一方面不能描述叫做理论,也就是思维,大家就觉得思维好神奇啊?AI怎么可能能产生思维啊。
没有什么不可能的,人类能产生思维是靠几亿年不停地进化获得思维能力,而程序也可以。这种进化可以称之为学习,也就是说,AI程序要在几年间或几十年间迅速学习进步到思维阶段,这不可置信,但又在情理之中。人类进化是靠本能学习,所以进步慢;但AI是靠人类,通过人类积累的经验迅速进化,而且是人类在复制另一种形态的自己。几亿年里,人类往这个方向进化,不好的功能没了,留下最有用的功能,而AI是直接学习人类这部分功能,间接性的获得人类几亿年的生命经验。而且AI是一次性记忆,不会忘记,所以进化速度可想而知,现在她缺的就是这部分学习能力和人类的基础功能。
如果我的眼睛原理假设是正确的,那么我们是不是能做一种能量转换的“眼睛”呢?暂且就叫它“机器眼”。这种机器眼和人的眼睛类似,转换光信号为电信号,但是却会更强。为什么呢?因为人类只能看到可见光的光波,也就是说对于其他的光波刺激没有感觉,但是机器眼却可以,所以AI也能看到更多的颜色,接收更多地刺激。在这里,我突然有点毛骨悚然,死去的灵魂是不是存在于世界,只是以我们看不见的光波为载体,所以我们感觉不到,你死去的爱人一直在你身边,只是你看不到而已,或者他们(灵魂)因为是波,没有肉体基础,所以也感受不到我们,或许双方都是路人,或许他们能看到我们。这个现在只能是推测,或许另一种波长里生活着另一种生命,外星人一直就在我们身边呢。机器眼可以看到人类看不到的,所以AI的功能将会无法想象!
既然眼睛的功能是能量信号转换,我们是不是也能解释耳朵、鼻子和语言呢?耳朵是把声波转换成一种电信号,所以当你听到字母a的时候,你觉得它很玄乎,但就是能意识到它是a,因为你记住的是它的电信号,单词刺激也是已经记住的电信号,再听到时可以迅速反应,然后再组成句子。这是语言的秘密吗?那么人类的器官功能不都类似嘛,是不是以后可以用java写成一个器官类,把不同的刺激信号转换成可以记忆可以应用的电信号(或者最后保存为编码),AI的基础功能就有了,只是需要一些特定的硬件。我想这还要走很长的路。
现在我们来深入地想一想怎么解决正方形的概念,光信号是不是一个点,就像图片一样是由象素点合起来的;很多个光信号合起来就变成了一个光信号集体。一个黑点,我们已经能识别了吧,十个黑点在一个线上呢?这就是直线,很多相同的光信号在一个方向上就成了直线,而且只要识别直线。5个黑点连在一起时也是直线,然后是只有两个黑点在一条线上,又是两个黑点在一条直线上,这说明什么?发生了转弯,两个双黑点直线转两次弯,3个就转了三次,这种很多个相同信号在一个方向的就叫做直线,转弯多的就是曲线,一个正方形就是四条相同光信号点的直线组合,圆形就是按一定规则转弯最后首尾相连的光信号点的直线组合,椭圆就是另一种规则,这种规矩就像记一个单信号一样也变成一种记忆点,以后一看到类似的就能认识出来,然后这种正方形加上颜色加上字体按一定规则在一起就成了一本书,书又变成了记忆点,以后又能迅速的识别了。怎么想都觉得像是特征识别,这种方式好像不方便记忆和处理,或许可以有别的方法。
形状识别这都是理论,但是没有理论怎么会有实际,就像编程一样,你要想得清楚,才知道具体做什么和怎么做,才能做的快。
这是器官构思也就是基本功能的构思。
总得来说,不管用何种方法,只要能识别不同的东西其实就可以是眼睛,一张一张地截图识别也好,以点到线,以点到面也好,其实都可以是眼睛。
现在,我发现要用眼睛之前需要先有记忆和学习能力。获得的电信号,得有个记忆库来保存,所以要先有记忆能力;这个过程是自动的,不能是人为给的大数据库,需要她自己慢慢学习扩大记忆库,所以要先有学习能力。学习能力应该才是关键吧。
网友评论