听说 Udacity 推出自动驾驶汽车工程师纳米学位以后我就去报了名。反正只有 250 个名额,谁知道报不报得上呢。可现在真报上了,又纠结有没有时间和精力去见证历史了。之前在网上看过一些课程,也没有达到预期效果的先例。
我这几年来的一大遗憾就是没有机会学习和使用深度学习,甚至一般的机器学习。肤浅地讲,将来去企业、研究所,肯定需要这方面的经验。而深度地讲,没有这些工具在手,我总是没有办法很好地实现自己的想法。很多想探索的地方,不知道怎样去实现,只能去问别人。说得不好的时候,不会用术语,别人不当回事;说得好了,别人自己就能实现了。总之思考很多,却没法行动。
其实在这方面可以说我是起了大早又赶了晚集的。早在 2010 年我就在美国某大学选修了人工神经网络(ANN)的课,还和别人合作做了个教授认为值得发表的项目。然而,那个教授给我写了推荐信以后,我申请美国学校的博士项目连续覆灭了两年(第二年全部撤换了推荐人),我也再没联系过他。我一直觉得这神经网络很有前景,尤其是 hidden layer,能从细节里抽象出来。但我接触到机器学习乃是大学毕业以后的事情了,碰到的尽是些陌生的理论(实为机器学习的基础)。两三年前,深度学习在我领域火了起来。我一直好奇这和我之前摆弄的 ANN 有何区别。我在一个课上提了这个问题,得到的答案是,没有区别。但毕竟现在工具全换了一套,从细致模拟神经元变成了更简单的非线性算法,要解决的问题也是和原来相差甚远,不得不重新学过。
所以我想着借此机会系统地学下深度学习。即使自动驾驶作为计算机视觉和机器人学相关的领域,跟自然语言处理实无关系,但我领域的好些东西都是从这种工程专业引进的。总不能老是坐看工程系的人抢我们饭碗,信息论说得头头是道。Udacity 对这个项目的广告推广不遗余力。作为一个就业导向的课程,它的合作伙伴包括奔驰、英伟达、OTTO 和滴滴出行。这倒是我担心的地方,如果课程太偏重职业培训,transferrable 的东西就少了。当然,计算机视觉和语言领域中的机器翻译等问题一样,都属于机器学习取得重大成功的地方。在我目前的课题上搞机器学习,理论服不了人,实验结果也没有提升——就现在的水平,谈论这些的影响还过于玄幻了。如果不满足于能发文章,而要避免课题成为理论的空谈,非郑重其事地简化问题不可。
我们学校对这种赶时髦或是特别专科的浑水是从来不趟的,强调的是 insight。或许几十年后看来,什么机器学习工程师就和现在工厂的熟练技工没什么两样吧?或者,可能还是要取决于人究竟是制服了这个工具,去实现自己的想法;还是为工具所制服,重复别人的想法?
以前在某大新生入学的活动里,有一个著名校友的讲座叫《君子不器,文理一生》。看标题很是宏大,以为有人生的奥义,但听完了也没觉出讲的内容跟标题有何关系。所以,我在文理之间摇摆了十年,恐怕还会继续摇摆下去。总觉空虚的时候,就去学技术,学了以后再用来琢磨语言和它背后的心。
网友评论