生活就是你和包围你的学习算法直接的游戏。你要么拒绝参与游戏,那么你就得在21世纪过20世纪的生活;要么从游戏中获胜。你想让你的计算机拥有你的哪个模型?为了产生那个模型,你能给它什么数据?
当我们在机器上(无论是手机、或是电脑)进行着这样那样的操作:搜索、购物、聊天、游戏……和过往任何一个时代最大的不同是,基于某种算法的机器对我们产生的影响正在日渐显著,我们仍视自己为操作者,而实际上,我们的每个动作,比如:手指做出的一个手势,每个选择,比如:一次点击,都是基于是某种算法和你的数据限定的,这些数据有些或许是你有意提供的,比如输入的搜索词,但你也许并不知道,在你还未开始输入的时候,机器已经掌握了关于你的很多数据,你使用的硬件型号,屏幕是多大,分辨率是多少,系统软件的类型和版本,你的IP地址,GPS坐标,你访问的上一个页面,你上一次访问的时间,停留的时间,你的曾经输入过的数据等等。
花点时间来考虑你记录在世界上所有计算机的数据:你的邮箱、办公文档、文本;推特、脸书和领英账号;你的网页搜索、点击、下载、购买;你的信用卡、传真、电话、健康档案;你的健康追踪器统计;你的汽车微处理器记录下的驾驶情况;你闲逛时被手机记录下来的信息;你拍过的所有照片;监控摄像机里的简短片段;你的谷歌眼镜片段。
除了书中列举的这些,我还能想到的:我们在QQ、微信、微博上发送过的信息,浏览过的信息,关注的人,收藏的内容、加的群,购物或消费时留下的点评,跑步或者骑行时经过的路,你的阅读记录、购书记录,图书馆的借阅数据,你喜欢的音乐,喜欢的乐队和歌手,收藏过的歌单……
这一切的数据,在《终极算法:机器学习和人工智能如何重塑世界》一书中,作者佩德罗·多明戈斯(Pedro Domingos)称为:数码镜子。在我看来,这面数码镜子,它如同一面魔镜:
《终极算法》不仅能够显示你的外表,还能显示所有关于你的、能观察到 的东西——一面栩栩如生,并能和你对话的镜子。你会问它什么问题?你可能不会喜欢它的某些回答,但这就更有理由来好好考虑这些答案;有些答案可能会给你新的想法和方向。你的终极算法模型甚至可以帮你成为更好的人。
也许你没有注意到,一个收集你的数据的疯狂比赛正在进行。《1984》中的电幕与之相比,不过是小巫见大巫。
每个人都喜欢你的数据,这也难怪,它们是通往你的世界、你的钱包、你的投票甚至你的心灵的大门。
我很喜欢多明戈斯在书中一段形象的比喻:
在信息处理这个生态系统中,学习算法是顶级掠食者。数据库、网络爬虫、索引器等相当于食草动物。……耐心的野兽飞快运转统计和分析算法,压缩并进行选择,将数据变为信息。学习算法讲这些信息吞下、消化、然后将其变成知识。
如果你还未意识到这一切都并非是科幻小说的桥段而是我们的现实生活,那么这个事件恐怕你也并不了解:2012年的美国总统选举是机器学习决定了谁能当上总统。
奥巴马总统雇佣了拉伊德·贾尼(机器学习专家,他是奥巴马竞选中的首席科学家)。……他们把所有选民的信息整合成单个数据库,然后将该数据库和他们能在社交网络、市场营销等领域找到的资源结合起来。……基于这些选民的数据,奥巴马团队每个晚上进行66000场选举模拟,并用这些结果指导奥巴马竞选的志愿者大军:该给谁打电话,该拜访谁,该说什么。
耐人寻味的是,在2016年的美国总统选举和英国退欧公投中,一些科学家也试图运用大数据来预测结果,比如:曾经在2008年和2012年两次成功预测了美国总统大选结果的数据大神Nate Silver,然而,他连续在9个州预测失败了。尽管如此,也有分析指出特朗普十分善于利用社交媒体,在大选期间超过一半的热点词都是特普朗引起的,特朗普在社交媒体上的支持率远远高于希拉里。你相信这是偶然吗?我猜这里面必定还有高人,有高明的算法。特朗普那些貌似不经大脑脱口而出的话,那些前后不一的表态,并非空穴来风。
别忘了,这是一场游戏。
虚假的信息,故意篡改的数据,是微妙的人性对机器算法的某种反抗。“如果你不喜欢某家公司,可以点击它的广告,这样不仅能够即时花费它的钱,通过为那些不太可能购买产品的人展示广告,还可以教会谷歌来再次浪费它的钱。” 虽然这样的想法未免过于幼稚,但是,水能载舟,亦能覆舟。掌握算法的人,他们懂得用什么数据可以四两拨千斤,这完全合乎逻辑。
在互联网上,没人知道你是一条狗1993年《纽约客》上刊登的一则彼得·施泰纳(Peter Steiner)创作的漫画,使得“在互联网上,没人知道你是一条狗”(On the Internet, nobody knows you're a dog)这句话家喻户晓。但其实,无论是一个人分饰多个角色,还是有组织的网络水军,在机器面前,很快就会原形毕露。你以为没人知道你是谁,其实,你早就暴露了,早就无所遁形了。
更接近现实的说法,应该是《1984》中温斯顿所说的:
“一个背影都可能将你出卖”。
图片源自网络在这样的一个时代,一方面,当然,我们应该重视保护自己的隐私不被侵犯和利用。另一方面,或许更为重要的是,要在这个智能机器和算法无所不在的时代,更好的塑造和展现自己。
你需要考虑的是,在你问魔镜:“我是谁?”的时候,它会不会给出令你满意的回答。
- 系列文集:《语文英语读写能力》
- 系列文集:《语文同步说文解字》
- 系列文集:《数理思维STEM》
- 系列文集:《机器学习和人工智能》
网友评论