创新挑战
概括来说,目前的人工智能产业发展面临六大挑战:
一、前沿科研与产业实践尚未紧密衔接:除少数垂直领域凭借多年大数据积累和业务流程优化经验,已催生出营销、风控、智能投顾、安防等人工智能技术可直接落地的应用场景外,大多数传统行业的业务需求与人工智能的前沿科技成果之间尚存在不小距离。面向普通消费者的移动互联网应用与人工智能技术之间的结合尚处在探索阶段。科学家和研究者所习惯的学术语境,与创业者和工程师所习惯的产品语境之间还无法快速衔接。
二、人才缺口巨大,人才结构失衡:据Linked In统计,全球目前拥有约25万名人工智能专业人才,其中美国约占三分之一。这一数量级的人才储备远无法满足未来几年中人工智能在垂直领域及消费者市场快速、稳健增长的宏观需求。人才供需矛盾显著,高级算法工程师、工程师、研究员和科学家的身价持续走高。人才结构方面,高端人才、中坚力量和基础人才间的数量比例远未达到最优。
三、数据孤岛化和碎片化问题明显:数据隐私、数据安全对人工智能技术建立跨行业、跨领域的大数据模型提出了政策、法规与监管方面的要求。各垂直领域的从业者从商业利益出发,也为数据的共享和流转限定了基本的规则和边界。此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。
四、可复用和标准化的技术框架、平台、工具、服务尚未成熟:虽然Tensor Flow、Caffe、MXNet等深度学习框架已被数以万计的研发团队采纳,相关开源项目的数量也在飞速增加,但一个完整人工智能生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需3年或更长时间才能真正成熟。
五、一些领域存在超前发展、盲目投资等问题:目前的人工智能技术只有在限定问题边界、规范使用场景、拥有大数据支持的领域才能发挥最大效能。但创投界存在盲目追捧,不顾领域自身发展程度,或利用人工智能来包装概念等现象。由此产生的盲目创业和投资问题虽非主流,但仍有可能阻碍整个行业的健康发展。
六、创业难度相对较高,早期创业团队需要更多支持:与互联网时代、移动互联网时代的创业相比,人工智能创业团队面临诸多新的挑战。例如,对高级人才较为依赖,科学家创业者自身的商业实践经验较少,高质量大数据较难获得,深度学习计算单元和计算集群的价格十分昂贵,等等。
垄断的优势
硅谷著名投资人、网景公司联合创始人马克·安德森说,大企业在AI领域拥有几个巨大的优势:
·懂得如何创建AI系统的人数非常有限。大企业可以为他们支付比创业公司更多的薪酬,就像雇用体育明星。大企业差不多可以把他们都收入麾下,留给其他企业的人才将少之又少。
·AI项目通常都非常大、非常复杂。这是全新的科技领域。亚马逊的Echo智能音箱是大约1500名工程师开发4年才完成的(注:马克·安德森这里说的工程师人数应该是有些夸大了,亚马逊CEO杰夫·贝索斯2016年5月在另一个场合的说法是:经过4年发展,Echo团队目前已有超过1000名员工)。创业公司可没法投入如此多的资源。
·此外,还有对数据的需求。你需要巨大数量的数据集来创建AI应用。谷歌和Facebook之类的大型企业可以访问浩如烟海的数据资源,而创业公司则只能望洋兴叹。
不同的声音总是存在的,而且还是不能忽视的意见。2017年5月16日,在第四届中国机器人峰会暨智能经济人才峰会上,已经65岁被称为“预言帝”的《失控》的作者与世界人工智能专家凯文·凯利(Kevin Kelly)在峰会上谈到,人工智能将细分出以创业公司为主导的小数据领域,在这里,如BAT谷歌等大公司会失去优势。
专业人士和普通公众也有理由对这些集中了大量数据和计算资源的AI平台提出合理的质疑。例如,这些平台特别是巨头联盟的力量将特别强大,它们对整个科技圈的舆论影响将是决定性的。体量较小的平台发出的不同声音,很难在巨头世界里传达给普通公众。
同时,巨头围绕AI建立的平台也缺乏足够的透明性,较难与外界保持有效的沟通。一旦这些AI平台的利益与公众利益不符,在商业上也找不到可以制衡这些大平台的第三方力量。举个例子,假如Facebook借助庞大的社交网络资源,希望通过智能算法主动引导信息流动,并进而影响美国总统大选时的选民倾向,这在技术上几乎是完全可行的。我们当然知道,目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性,但从法律、道德角度,我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司,巨大的商业利益永远是诱惑它们“作恶”的诱饵。
对数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。更糟糕的是,巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下,会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜,接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助,而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法:一个用户越是频繁购物,就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在,信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。
目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据,在商业利益和激烈竞争的驱使下,它们会不断地竞逐更为精进的技术能力,为公司赚取更大的利益。对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。
一些公司选择通过自律或推动立法来限制错误的发生,但另一些公司不会这么做。自然而然,比较规范自律的公司由于发展顾虑更多、更全面,相对发展速度上可能放缓;而较不顾虑错误发生的企业,反而可能成为最快速或最成功的那一方。这很难说是一个好的还是不好的发展态势。
资本主义的市场竞争是不会激励大家分享数据、资源和市场的。传统的政府监管方式过去曾经行之有效,但在面对互联网的开放和动态结构时,这种传统的监管方式将会失效。现在这些AI、比特币和其他所有领域中的问题,都不是过去10年、20年间学者们研究的题目,而是真正在资本市场能够快速赚钱的技术。然而相较于开放的互联网,行业不曾充分在开放领域来探讨这些技术衍生的问题和现象。
总的来说,巨头垄断大数据资源、垄断科研与舆论的风险客观存在。而在国家政策层面、法律法规层面甚至道德层面,我们还缺乏应对这种潜在风险的有效体系。
后来居上
根据创新工场的统计,在2006年到2016年的时间段里,近两万篇顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29. 2%和31. 8%。近10年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。从统计角度来看,这已经是超出平均水平的科研贡献了。
从2014年和2015年开始,中国人/华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!
当然,需要特别指出的是,我们不能单看这些反映整体趋势的统计数据就沾沾自喜。事实上,上述数据所表现的,仅仅是中国AI科学家以及全世界的华人AI科学家作为一个整体,已成为AI科研的最大阵营这一事实。但从突破性科研贡献的数量和质量上说,中国还无法与美国相比。如果只统计那种革命式的、里程碑式的突破,中国人或华人的占比就会少很多了。深度学习“三巨头”中没有一个华人面孔,这个事实至少说明,中国或世界华人科研群体中,还缺少顶级大师式的人物。用围棋的段位来比喻的话,就是中国在人工智能领域拥有不少六段、七段甚至八段的高段位棋手,但暂时还缺少九段的顶级高手。
一方面,客观承认中国与美国在AI前沿科研上仍存在较大差异;另一方面,我们也必须看到中国AI科研力量的蓬勃兴起。中国国内的研究者和分布在世界各地的华人研究者,他们在人工智能领域共同构成了一个巨大的人才储备库。
尽管存在诸多挑战,但仍然可以大胆预测,在未来5年内,中国将会诞生许多世界级水平的人工智能企业。为何会如此坚定?因为中国具备了人才储备、行业需求、庞大市场、生态系统等许多极有利于人工智能发展的条件。
人才储备方面,除了上面提到的中国科研力量不可忽视之外,中国人也普遍对国内的数学等理工科的教学水平感到自豪。高水准基础科学、工程学教育可以造就大批高素质的年轻人才,这是任何一个新兴产业赖以发展的关键。
中国学生普遍理工科较强,数学较强。这在人工智能时代里,显然有巨大的优势。庞大的理工科学生基础,造就了一大批高素质的人工智能科学家、工程师。同时,即便是没有专门去学计算机科学的学生,他们中有很多已经具备了非常扎实的数学知识,这些学生在需要时可以通过培训,较快地成为掌握深度学习等人工智能技术的算法工程师。
行业需求方面,中国的传统行业较为薄弱,但这种状况反而给中国带来了一种后发优势。如今,中国许多传统企业在技术转化领域还大幅落后于美国企业。但是这些中国企业坐拥的是海量数据和充沛资金。它们有热情也有动力去投资那些能帮助企业拓展业务、提高收益、降低成本的人工智能技术与人才。
此外,中国有全球规模最大的互联网市场,网民人数近八亿,大量的互联网公司正在深耕市场。很多非人工智能的互联网公司成长到一定规模之后,为了转型升级、扩大规模,都需要引入人工智能技术。而且,中国市场既开放又有许多独特性。尽管美国人工智能企业领先全球,但它们要想进入中国市场必须跨越重重阻碍,因为中国市场需要的是最“接地气”的本地化解决方案。此外,对于人工智能的探索性和试用性需求,中国往往会采取相对开放和鼓励的路线,这也可能促进行业的超速发展。
也就是说,中国虽然在人工智能的前沿研发中不如美国,但中国有独具优势的AI科研和创业环境,有机会实现弯道超车,后发先至。
网友评论