作为上海人的一大便利,就是家门口有很多高水平的活动,比如演唱会、展览、电影节、时装周,当然,还有学术报告会。比如,7月2日开始为期三天的SSIST, ShanghaiTech Symposium on Information Science and Technology. 今年的主题是Artificial Intelligence,Web Security and Smart Energy.
感谢上海科技大学的筹办,使得几十位世界级大牛与我的距离,缩短到了5站地铁。这几天能见到很多耳熟能详的大牛,包括Yann LeCun, Harry Shum, Dawn Song, Tie-Yan Liu, Yuandong Tian, Weiming Ma, Shuicheng Yan等等。
预热环节,第一天是一个工业创新论坛。尊敬的上海科技大学校长江绵恒,将于第二天致开幕词。
第一天邀请的嘉宾,在工业界有很全面的代表性:
马维英,今日头条VP,前微软亚洲研究院副院长。
黄华,华为MBB总监。
闵可锐,猎豹移动首席科学家,本来计划的傅盛先生因故没有来。
徐立,商汤科技CEO。
颜水成,奇虎360 VP。
马毅,上海科技大学教授。
主持人是Delaware大学的虞晶怡教授。
(由于专业能力有限,时间仓促,以下诸多谬误之处,在此致歉。)
虞晶怡教授作为CVPR方向的学者,开场给我们做了一个生动的增强现实Demo,在实时的手机摄像中,可以随意放置物体,比如一个唐三彩的雕塑马,一个地上的小人,或是真人大小的跳舞女郎,可以做到很逼真的效果,几乎看不出来是加工上去的,还能360度远近观看,你懂得。
闵可锐作为猎豹移动的首席科学家,给了第一个talk,介绍猎豹移动。我也是从去年才开始频繁听到猎豹移动和傅盛的名字,其实我们并不陌生,成立于2010年,它的前身是金山网络。
猎豹移动悄悄做到了Google Play全球非游戏类应用榜单排名第三的移动应用开发商。Talk中提到了两个我几乎没听过,但已经做的很大的产品,海外排名第三的News Republic,类似今日头条,做个性化内容分发;live.me,美国排名第一的直播平台。
关于技术分享,闵可锐大牛介绍了News Republic的智能推荐,用到一个learning to hash的方法将512维特征降到64维,从而提升系统性能。
也提到了一个新产品,小雅音响,售价699,6+1环形麦克风阵列,可以在5米范围内保持很好的声学特性,具有更温暖更具有情感的人声(很可爱的小姑娘),平滑的合成语音,包括中英文转换。用户不必担心播放出的声音干扰小雅音响的语音指令识别,因为它的“有呼必应”特性在去回声、去噪声方面做了很多优化。
来自华为上海的黄华总监,供职华为17年了,笑侃自己超过了45岁(呼应今年的华为45岁裁员传闻)。黄华总监介绍了人工智能在华为移动网络方面的应用。最开始他们聘请了很多俄罗斯、法国的数学家,进行rule-based的研发。我们知道俄罗斯的数学非常强,但最后网络环境复杂到数学家也无法解决了。再精妙的参数,也无法适应万变的应用场景,包括天气气候,不同国家,城市乡村等等,哪怕同一个建筑内的位移,也会对无线信号产生很大的扰动。而网络设备本身也在变得更复杂,预计4G到5G网络,天线数会增加到64个。
在多变的网络环境、网络信号下,reinforcemeng learning正是用武之地,让它适应性地自我学习,实现了7%的提升。
黄华总监还多次提到了《奇点临近》这本书,一并推荐给大家。
颜水成先生,曾经是新加坡国立大学的计算机教授,近年从学术界跨入工业界,加入奇虎360,领导人工智能研究院。从学术界到工业界的转变脉络,也在他的talk中隐约有所体现。
颜老板提出了人工智能的两个追求方向:
- 精度极限
- 产品体验
包括我个人,注意力常常在精度极限上,也体现在学术界不断刷新各个标准数据集的精确度记录,Kaggle、天池竞赛依据某个量化分值排名参赛队伍。但对精度极限的追求,不是人工智能的全部。
能将二者结合起来的经典范例,就是大公司的AI Labs,对精度极限和产品体验的联合追求,可以互相促进,形成良性循环。
颜老板还分享了residual network v.s. densely connected networks;介绍了人工智能在图像分割的应用,比如美图类软件的人像抠图和背景置换,美颜和去美颜;低功耗的深度学习应用场景,比如车载镜头对路况标志的识别,手表应用等。
来自商汤科技(SenseTime)的徐立,口才了得,为我们介绍了一把“人工智能忽悠史”。这里大家感受下列历史事件,从中可以看到一些起起伏伏:
- 1956年,达特茅斯会议标志AI诞生。
- 1957年,罗森布拉特发明第一款神经网络,进入第一个高峰。
- 1970年,受计算能力所限,AI进入第一个低谷。
- 1982年,霍普菲尔特神经网络提出。
- 1986年,BP算法实现了神经网络训练的突破,进入第二个高峰。
- 1990年,人工智能计算机DAPRA失败,进入第二个低谷。
- 2006年,深度学习神经网络被提出。
- 2013年,深度学习算法在语音和视觉识别率获得突破性进展,进入第三个高峰。
徐立的表达和总结能力很强,他认为和人一样,人工智能的突破,也是按照“看、听、说”这个顺序。深度学习的突破,关键节点在2012年的ImageNet图像分类竞赛,深度学习方法准确率达到85%,相比前一年提升11个点,2013年又提升到89%。而我2012年开始读博士,2014年辍学,不胜唏嘘。
徐立还分享了融资时的趣事,他自己的公司也做了一个200块GPU的训练系统,可以将24小时训练时间缩短到6小时,当时某大公司也从Nvidia(英伟达)采购了6万块GPU,以此向投资人说明自己公司应用的GPU技术的靠谱,后来这个投资人就没了下文。再过了两年,这个投资人总是给他发红包,原来他没有投商汤科技,而是买了英伟达的股票,要感谢他的信息。我查了下K线,8倍收益。
从这两件事可以看出,深度学习和GPU,是这次人工智能浪潮的助推器。虽然谷歌搜索在大陆被封锁,但中国大陆仍然是Google Trends中搜索deep learning最火热的地区。
机器学习应用,基本要经历从技不如人,到超越大众,再到超越专家的演进。而今后很多带“老”字的职业,都可能被取代,比如老中医,老司机。
茶歇之后,是一个圆桌会议。
我认为很成功,主持人准备了很优质的问题,活跃地引导现场气氛,让非常资深的各位嘉宾吐露了不少干货。印象比较深刻的问题有:
创业的4W(what, who, where, when)。
因航班一再延误而中途到场的马维英先生(也是我在微软亚洲研究院时期的大老板),介绍了自己临近50岁而创业的心路历程,并深刻解读今日头条的产品布局,大有可为的人工智能应用场景。作为台湾人的马先生,很儒雅有风度。又让我想起罗永浩说,台湾老板常常给人如沐春风的感觉。
关于什么人适合创业,马毅教授提到不应该鼓励大学老师创业,因为他们作为科技放大器,有着更长远重要的使命。已经从学术界转入工业界的颜水成教授发表了一点不同看法,认为对于专业性极强的人工智能领域,知名大学教授更容易获得投资界的信任,并依靠自己的专长和资源获得成功。
而对于适合创业的人都具有什么特质,大家都表示,真的没有什么规律,这么多年的观察下来,什么案例都有。
关于地点,徐立表示,要离大学近,离人才近。
关于创业时机,嘉宾表示,要结合行业的发展,也要结合自己的人生规划。
主持人的一个刁钻问题是,请为自己的公司做一下招人宣传。于是各位老板各显神通。
今日头条的马维英最近经常招人很熟练,又慷慨陈词了一番,介绍闭环下的个性化内容分发平台,大有可为,并具有非常有竞争力的薪酬。华为的黄华总监透露了一个秘密,华为作为多年不上市公司,不用对资方缴纳巨额利润,赚的钱都会被大家分掉,现在加入华为是在山顶上等收获。360表示自己马上要上市,加入可以享受IPO的红利。SenseTime作为初创公司表示自己工资高且有股份。
唯一一个来自观众的问题是,人工智能还会火多久?媒体的热炒会产生哪些负面影响。这也是我和很多人心中的疑惑。嘉宾有的表示,这才刚刚开始,二三十年不成问题。有的比喻今天为,春夏秋冬的秋天,我理解秋天是收获的季节,之后可能是冬天,冬天过后又是四季的轮回。
(未完待续)
网友评论