自然语言处理在2017年有哪些值得期待的发展?
12016 年是深度学习的大潮冲击 NLP 的一年,果实丰硕。从底层的 pos tagging, word segmentation, NER,到高级的任务比如 semantic analysis, machine translation, machine reading comprehension, QA system, natural language generation。都是全面开花,Deep learning for NLP 的架构越来越成熟。那么在 2017 年,我们又有什么样的期待呢?
我想对于这个问题最有发言权的应该是 Christopher Manning——他在 Computational Linguistics and Deep Learning 中的一些论点到了 2017 年依然成立。
NLP 无疑依然是机器学习有待攻克的下一个重大领域。但是由于语言本身已经是一种高层次的表达,深度学习在 NLP 中取得的成绩并不如在视觉领域那样突出。尤其是在 NLP 的底层任务中,基于深度学习的算法在正确率上的提升并没有非常巨大,但是速度却要慢许多,这对于很多对 NLP 来说堪称基础的任务来说,是不太能够被接受的,比如说分词。
2这年头,什么都能造假。钱是假的,食品是假的,统计数据是假的……只有熊大对水妈的压榨,是真的!今天来讲讲统计图如何给人造成视觉上的错觉,起到“造假”的效果。素材来源于两次组会和熊大的课堂。
最近团队在推进大气污染研究的项目,这是一次组会上的汇报。分春夏秋冬,分别汇报了一些站点的PM2.5时间序列曲线。大家看到这组图第一感觉是什么?
水妈第一感觉是:春天在哪里呀,春天在哪里(情不自禁跟着唱起来)!右上角明明是春天了,怎么PM2.5还这么高(跟左上冬天一个水平)!再仔细一看,左上的纵轴高度是400+,右上的纵轴高度是300+。
在分组汇报同一指标的时候,纵轴的高度要统一。不然非常容易引起读者的错觉。同样的例子,还有下面这组图。
2-数学模型教你如何成为星际争霸高手·下——向机器学习
3孔子说:“温故而知新,可以为师也”。“知新”意在探索未知,而未知往往能极大地满足人们与生俱来的好奇心,这是我们大家都喜欢的。这句话真正的难点在于“温故”——“故”代表人们所知道或学过的东西,不及“知新”那么有挑战性。新鲜感一旦褪色,动力也随之消沉,“温故”自然也变得遥不可及了。
小编在《星际争霸上》中用逻辑增长模型(Logistic Growing)和捕食者模型(Predator-prey Model)告诉大家星际争霸高手的修炼途径。不过因为缺乏“温故”,小编再次惨败于电脑。
网友评论