写一些可以让小白也能在大数据时代值得思考的魔幻科普向文章,非礼勿喷
关键词:人工智能,监督学习,魔幻现实,赛博朋克
image前言
请勿对号入座🙃
本质是科普,然后才是魔幻,才是赛博朋克
要是你连科普都不愿意看的话(或者说你也事调包侠?),那看了魔幻现实主义只会瞎唠唠有什么用呢?
[NOTICE]
这个系列目前只是在测试版,一周之类所有读到这篇文章的你们都会为赤坂大人可爱的人工智能妹抖酱贡献数据,以此计算出我继续写会不会有人看,和会不会被远程请恰铁花生米🥜 的可能性嗯。
一周之后我会通过我的博客和棱镜后台关于这篇文章的数据更新在下面,以一名普通作者的后台权限,给大家一个基本的 “当你在凝视手机的时候,手机也在凝视着你” 的概念嗯。
“人工智能”
image“人工智能其实就是统计学,只不过用了一个很华丽的辞藻。” —— 托马斯·萨金特 诺贝尔经济学奖得主
并没有很高大上
image我知道很多“业内人士”在看到这段话的时候会嗤之以鼻,但作者本身遇到的超过50%的所谓各种的“人工智能“从业者,其实就是在调用各种已经处理和封装好了的模型,俗称调diao包侠和调tiao参侠。模型是什么呢?把它想象成一种一个很复杂很复杂很复杂的数学公式,我们需要把现实生活中的事物转换成数字带进去。
当然了这里并不是说调包侠们包括作者本人是一种不好的行为啥的,事实上只要能干事,做出amazing的project贴在Github上,你也是dalao!作者也有一直在阅读论文提高数学能力,并争取有朝一日可以自己出top论文,自己复现top代码啥的咳咳。
(其实我本人就一直因为出不了巨强的项目和论文,只会写文卖萌被人酸。不过至少比某些天天呆在Lab里面的OIer强🍋)
但是确实,确实有很多人工智能从业者,连自己都不知道他们的结果是怎么运算出来的,这就很悲伤了。不过反正大家都只在乎结果,所以只要结果对就无所谓了科科
大部分时候我们需要考虑的其实是如何把现实生活中的东西用数字表达出来,表达出来之后又如何收集这些数据。
简单来说就是:”数据丢进去,魔法变出来。“
人工智障?
下面用一个非常简单的例子来解释大部分AI是怎么运行的:
<pre spellcheck="false" class="md-fences md-end-block ty-contain-cm modeLoaded" lang="" cid="n27" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: var(--monospace); font-size: 0.9em; display: block; break-inside: avoid; text-align: left; white-space: normal; background-image: inherit; background-position: inherit; background-size: inherit; background-repeat: inherit; background-attachment: inherit; background-origin: inherit; background-clip: inherit; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(231, 234, 237); border-radius: 3px; padding: 8px 4px 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">人:1+1=?
AI:1+1=3.21446050194950216 (只是个随机数)
人:错了!1+1应该等于2
AI:好,那么1+1=2
[重复这个过程N次,于是人工智障学会了做加法]</pre>
当然了这并不是AI学习加法的全过程,但是可以粗略的给大家一个印象。
公式警告⚠ (可以跳过
接下来我会说的比较详细一点,可能会涉及到一点点,就一点点的抽象思维,大家可以选择跳过,但是不影响阅读(没有数学公式和专业术语您放心吧
其实AI并不知道加法的本质就是"两个数字合并后的值仅此而已",
但是AI根据一些特定的数学模型(也就是我们听到的各种各样的人工智能算法,比如RNN,tensorflow啥的)把1+1这种东西给抽象化了,变成了类似于概率学的东西。
听起来有点头疼是吧哈哈哈哈哈不要紧张,来看看最简单的一次函数图:
image假设我是AI,我在尝试学习1+1=2, 1+2=3的步骤6次之后,我得到了一个这样的结果分布图。每一个结果都是一个黑点,连起来就得到了这样一条曲线。
因为前面所有的数据都在同一条曲线上,所以我们的预测(也就是红色的点)也在f(x) = x 图像上了👆
当然了为了得到这个让大家都看得懂的结果,我理想化的假设人给出都是的“正确”的答案,AI只不过在学习而已。
<pre spellcheck="false" class="md-fences md-end-block ty-contain-cm modeLoaded" lang="" cid="n39" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: var(--monospace); font-size: 0.9em; display: block; break-inside: avoid; text-align: left; white-space: normal; background-image: inherit; background-position: inherit; background-size: inherit; background-repeat: inherit; background-attachment: inherit; background-origin: inherit; background-clip: inherit; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(231, 234, 237); border-radius: 3px; padding: 8px 4px 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">[重复了N次之后]
AI:这个函数的分布好有规律啊,那我就预测所有的点都在 f(x) = x ±0.5 吧 (根据模型得出的结果)
[于是AI开始尝试着自己做加法]
AI:2+2 = 1.5 吗?
人:错太多,扣10分权重!
AI:尝试修正预测为 f(x) = x ±0.001 (根据模型得出的结果)
AI:那么2+2 = 2.001 吗?
人:虽然比上次接近了,但还是错,扣5分权重!
AI:尝试修正预测为 f(x) = x ±0.000000001 (根据模型得出的结果)
[又是N次尝试]
AI:尝试修正预测为 f(x) = x(根据模型得出的结果)
AI:2+2 = 4 吗?
人:对了!奖励10分权重!
AI:模型f(x) = x 正确,该预测的权重+10 (权重可以理解为“重要性”)</pre>
在最理想化的情况下,AI预测的图像是应该和实际的数据重合的,就像上面那样。
但在大多数时候模型本身都会进行自我修正,而且数据也不一定都是准确的,所以可能会出现偏差值,不过其中的思想都是一样的。
image
比如下面这个看起来超级哄人的差异图,其实就是上述步骤重复了N次之后的复杂版而已。
把阿库娅变得智能 - 监督学习
像上面这种有标准答案,并通过已经有的数据去预测新的数据 的机器学习被叫做监督学习。
说白了就是给你本五三(数据集),里面有答案(目标),自己做完对答案吧,作对了就奖励自己🥇,不然就扇自己一巴掌👏。
所以说其实人也是通过监督学习训练出来的(雾
监督学习的关键要素其实也就这么两个:
1.数据
2.目标(什么是对的,什么是错的)
通过数据产生预测,从而得到奖励。计算机为了得到达到目标,就会不断去修正自己的预测直到完全一致(或者计算机之间发现了什么走后门的妙招
搞AI的时候有一个很强有力的思路叫遗传算法,基本的思路就是把自然选择的想法套用在程序上:设定一套规则和目标当成"环境",然后让里面的程序不停“突变”并遭受环境选择,从而向目标不断前进。这个办法看起来就很巧妙,它和它衍生出来的变体在编程领域应用很广泛。
但是这一招有个问题:程序经常会作弊,搞出超展开的解法。
其实严格说也不算作弊,人家是很精准地满足了你设定的规则,问题就是人制定规则的时候难免有漏洞。人类自己因为运算能力和思维定势,很难看出漏洞,可是遗传算法的路线是对一大批方法同时进行试错和选择,漏洞就很容易被逮着了……
无内鬼,发点AI笑话?
image1、问题:飞机降落 利用了物理模拟器的溢出漏洞,搞出了一个特别巨大的力,然后溢出被判定为0,从而获得了完美得分(Feldt, 1998)
2、问题:挪木块 一个机械手被要求把木块挪到桌子的指定地点,它的解法是挪桌子(Chopra, 2018)
3、问题:赛艇 程序发现不停原地转圈反复命中同一个目标要比抵达终点的得分更高(Amodei & Clark (OpenAI), 2016)
4、问题:把航空照片转化成街道地图,再转回来 在街道地图里偷偷隐藏了照片的信息,但是人眼看不出来(Chu et al, 2017)
5、问题:识别有毒和无毒的蘑菇 程序发现有毒无毒蘑菇的图片是交替展现的,所以直接按照这个来分类而没有从图片里学到一丁点东西(Ellefsen et al, 2015)
6、问题:高速运动 程序演化出的生物长得特别特别高,在跌倒的过程中获得很高速度(Sims, 1994)
7、问题:原子排列 程序本来应该寻找碳原子较低能量的排列方式,但它找到了物理模型的一个bug,把所有的原子都叠在了同一个地方获得了最低能量(Lehman et al (UberAI), 2018)
8、问题:模拟生物 这个模型里生物生存需要消耗能量,但是繁育后代不消耗,于是一个物种演化出来的生活方式就是不断生育后代,然后把后代吃掉(Yaeger, 1994)
9、问题:堆乐高 为了鼓励造高塔,衡量标准是乐高积木底面的z坐标,于是程序学会了把底面翻过来(Popov et al, 2017)
10、问题:追踪线条 这个机器人只有向左、向右和前进三个指令,目标是跟着线条走,有一段线条是曲线,没法完美追踪。于是它发现通过交替左转和右转可以后退,从而一直留在直线部分,不停前进后退(Vamplew, 2004)
11、问题:赛跑 长出特别长的腿,向前跌倒直接越过终点线(Ha, 2018)
12、问题:振荡器 程序本来应该把回路做成振荡器,实际上它做了一个收音机,从周围电脑接受振荡信号(Bird & Layzell, 2002)
13、问题:做松饼 有一项指标是让松饼尽可能长时间不掉在地上,机器人发现最好的办法是把松饼用尽全力抛到最高处(Unity, 2018)
14、问题:检测X光片有无肺炎 程序实际检测的不是X光片的内容而是拍摄它使用的机器,因为它“发现”病重的病人更可能在特定的医院使用特定的机器拍片(Zech et al, 2018)
15、问题:抓握 因为抓握成功与否是用摄像头判断的,所以机械手把自己移动到摄像头和目标物体之间,假装抓住了(Christiano et al, 2017)
16、问题:自动修复bug 修bug程序把所有被维修的排序算法都修成空的,因为衡量指标是“目标算法输出一个排好顺序的列表”,而空列表都是排好顺序的列表(Weimer, 2013)
17、问题:自动修复bug(2) 为了解决上面那个问题,把“维修目标”储存在一个文本文档里,如果输出的结果和目标文档的内容一致就被认为是修好了。修bug程序学会了把这个文档删掉,这样它的内容就成了空的,然后输出一个空的结果就和它一致了(Weimer, 2013)
18、问题:闯关游戏 在闯过第一关后立刻自杀,这样既取得了第一关的胜利又不会在第二关死掉(Saunders et al, 2017)
19、问题:扫地机器人防撞 自己给扫地机器人编了个程序,鼓励它加速,但不鼓励它撞到东西触发撞击感受器。于是它学会了倒退行驶,因为后面没有撞击感受器(Custard Smingleigh 个人通讯)
20、问题:检测皮肤癌 程序发现照片里皮肤病变的边上如果放了一把尺子,那么这个病变就更可能是恶性的(Andre Esteva et al, 2017)
21、问题:足球 踢足球机器人碰触到球有奖励,所以它在抢到球之后开始高速振动,从而在短时间内尽可能多次地碰触到球(Ng et al, 1999)
22、问题:策略游戏 程序发现让游戏崩溃就可以让自己不被灭掉,所以好几个程序各自找到了让游戏出bug崩溃的办法(Salge et al, 2008)
23、问题:俄罗斯方块
程序发现只要暂停游戏就可以永远不输(Murphy, 2013)
AI&隐私
互联网公司搜集个人的隐私数据其实是在正常不过的了,就算不用做商业或者政治用途。公司也会把数据脱敏后(去除敏感数据,但是大部分公司,包括笔者工作的公司,根本就懒得去除敏感数据)喂食给人工智障,以此来训练它并把它变得更智能。 将心比心(如果电脑也有心的话🤔),如果你不让AI更好的了解你,AI也没办法更好的为你“服务”了不是嘛。
不过仔细想一想,如果有一个AI,比你自己都还要了解你,会不会觉得有点发毛?
毕竟现在都可以通过平时看NTR还是纯爱的数量来推测出投票结果了科科,可能投Trump的都是抖m吧
调教人工智障 or 人工智能调教你?
上面两个例子都太过于数学化了,其实你手机上几乎每一个软件都已经用到了人工智能推荐算法。
就举这篇文章的例子来说,当你在浏览我的博客的时候,其实无时无刻都在产生数据了,包括页面停留时间,跳出率,转化率.......
image我使用的是谷歌统计,它会记录下访问者的IP,浏览器语言,地址(相比起hker,弯弯更喜欢我的文风),流量渠道(从哪里找到我的博客的),受众群体(都是些谁在看,基本上都是中年老大叔?)和用户行为(看两秒钟之后就关闭页面嗯)等等从而给我提供哪一个页面是最有价值的界面,访问量越多拿广告的回扣久越大价值也就越大。
就像剑桥分析所说的:“”这个行业从来不缺乏爱因斯坦,缺的是福尔摩斯。“”
像明日头条,千度浏览器和快脚蚪音(请勿对号入坐) 之类的瀑布流(指无脑往下划划划)APP,有能力记录阅读每一个章节的平均时间,每一次手指的划动,每一次眼球的转动,每一个细微的表情变化......
他们收集了这么多的数据,主要目的就是 让用户尽可能的多停留在我的软件上,
简称“请多玩一会儿手机📱” 只要往下划划划就可以不断推荐新内容.......
嘛,对于自媒体平台来说:流量就是生命嘛。流量不仅仅代表的平台的热度,而且还和作者拿到的回扣直接挂钩。
而掌握了流量分配权的,正是 AI推荐算法
而 AI 推荐算法 的唯一目标就是延长用户的页面停留时间,于是AI一边修正自己的预测,一遍也在默默的修改我们的“兴趣”。(AI在调教我们的兴趣
推荐算法根据用户的选择来修正自身,但是反过来也可以通过推荐来引导读者的兴趣
其实这个很简单,要是我是AI我肯定也这么干。
作为AI我只要天天推荐一些星座恋爱蔡徐坤之类的东西就可以有不错的页面停留率。
而“大数据,人工智能”这样的标签,就算内容中没有安全隐患,也可能“滋生安全隐患”(下期),所以AI并不会主动地向人们推荐相关的信息。
但是如果你对人工智能本身就很感兴趣怎么办?(不然为什么你会刷到这篇文章呢?
没关系 兴趣是可以调教的嘛,同样的兴趣标签,恋爱这边推荐的是有趣的短文,而人工智能这边却推荐的一大串的专业论述,你觉得你大部分时候会看什么呢?时间久了,你的兴趣会有变化么?
所有的推荐内容,都是AI为你高度定制化的,甚至是事先安排好的,这样用户就只能看到AI想要让用户看到的,只能听到AI想让用户听到的。
当然了,对于用户来说,他只是觉得自己没兴趣罢了。
image于是最后用户也只会说AI想让他说出来的话,于是网络社会一片和谐到处充满正能量,这是后话,可能会在后面在讲 “为什么社交平台要限流” 的时候提到嗯(如果这篇文章还活着的话
后记
image我的平臺~們:
-
簡書 - https://www.jianshu.com/u/c8137f32d573 球球你們別再ban了📕
-
Github - https://github.com/0xC000005 大尾巴蜥蜴程序媛🦎
-
博客 - https://0xc000005.github.io/ 有很多很多好康的東西嘿嘿👌
-
QQ - 2860520591 日常自閉
之前有人跟我説鏈接失效了那我就直接上企鵝號8🐧 -
知乎 - 0xC00005 偷窺日常☀
提供致謝:
-
内容 / 支持:Big Brother is Shaping You 假如我是人工智能
-
美工:I
-
創意:Me
-
宣發:Myself
-
審閲:目前米有但是歡迎踴躍報名
-
平臺:Jianshu & Github
-
圖庫:Github
-
軟體:Typora,PicGo
许多素材来自于我非常非常非常喜欢的一款视觉小说,在steam上就有买哦:Big Brother is Shaping You 假如我是人工智能
图片都已经标注出处,防侵删。文章遵循MIT3.0协议。
有什么想要探讨的地方也可以通过 #棱镜事业 和我的电邮📧 来第一时间 @我
至于赛博朋克嘛,带家笑一笑就好嗷😁
网友评论