美文网首页
种子杯总结

种子杯总结

作者: 执剑人罗辑 | 来源:发表于2018-11-04 23:50 被阅读0次

这次算是第一次实战深度学习,虽然做出了一个成品,但是其中还是有很多原理自己不懂,怎么优化,一些数据的处理细节和工作细节,要自己来做的话可能要花很多很多时间处理。

具体感到陌生的地方有:

数据的读取

数据预处理

神经网络的工作原理

神经网络的优化细节

在这次种子杯比赛中,学习到的知识有:

如何构建一个用于深度学习的模型

如何把数据输入到模型中,得到训练结果

大致了解了keras各个层的作用和使用方法,各循环层,全连接层,嵌入层,正则化,层池化层等。层的大致作用和搭建顺序,接收参数和返回对象。

构建一个深度学习模型的步骤:数据预处理,特征提取,模型训练,模型融合

如何使用Jupyter和google colab进行编写和训练。

看了别人的分享,感觉到跟我们组的差距有:

数据预处理的差距,预训练的词向量到最后也没有实现,也不知道是否实现正确,应该正确的预训练词向量是有提升的。还有针对数据的分析,发现数据偏移的扶正,这些都没有想到。

特征提取方面的差距。我们是字词一起训练的,也没有区分标题和描述的区别。很多队伍都把字和词分开训练,标题和描述区别开来或者干脆舍弃掉一些数据来避免干扰。事实上这样的效果很好。我们是想到了的,但是没有时间去尝试和优化了。

网络模型的差距。我们的网络模型基本上还是完善的,虽然没有对参数进行优化但应该还是基本达标了的。对最新的模型的研究没有想到,有队伍实现了最新的论文中的模型,似乎效果很好。但这也不是理由,因为别人单个CNN模型的表现比我们融合了之后还好。

对结果的处理,第一的队伍提到了mask,可以处理预测中不存在的分类。这个当时警告的时候就想着该怎么解决,原来解决方案是这样。下次就知道怎么做了。

先采用传统的机器学习方法作为baseline,这个想法很好。因为传统的模型计算量少,迭代快。用来研究问题的性质,其他工作的质量都很方便。然后最终也可以作为模型的一部分,取得同样不错的效果。

我们组不足的地方主要在于不知道为什么训练这么慢,是因为batch_size的原因,导致复赛的模型测试优化的次数太少,浪费的时间太长。然后就也没有精力做其他的优化或者一些想法了。然后选取模型也比较随便,就是凭感觉,以后也要注意。

总的来说,这次种子杯还是收获很多的,也是第一次实践深度学习,掌握了挺多编程实现细节与方法,要点与注意事项。然后也鼓励了自己,第一次尝试也算成功,接下来的路还有很长要走,但是也感觉很高兴能找到自己喜欢感兴趣的方向,有一起努力的志同道合的小伙伴。

相关文章

  • 种子杯总结

    这次算是第一次实战深度学习,虽然做出了一个成品,但是其中还是有很多原理自己不懂,怎么优化,一些数据的处理细节和工作...

  • 首届“金种子杯”《安徽诗人》年度诗歌奖(中国长淮诗歌奖)征稿

    首届“金种子杯”《安徽诗人》年度诗歌奖(中国长淮诗歌奖)诗歌大赛,正式启动,详见正文《活动方案》。 首届“金种子杯...

  • 学习!反思收获

    学习1小时功夫学习收获反思总结 我有一个不舍得付出的种子,而且付出愿意交换条件的种子。 总结反思,家庭关系,不舍得...

  • 两年共学“坚持的力量”

    |『种子行动』| 团队共学《论语》之 与(完结)#大总结#第124次 …… …… 今天是【论语】全书总结的...

  • 鹏城杯总结

    一个强大的队伍背后一定有强大的后援团,CTF竞赛怎么能少了远程支援,简单介绍几个常用的线下赛技巧。 1.ssh连接...

  • 【城市物语220】黑咖啡

    泯灭一颗颗种子 扼杀生的可能 只为一杯醇香

  • 阜阳市 "金种子" 杯第二届盆景精品展开幕式

    阜阳市 "金种子" 杯第二届盆景精品展开幕式 2019年8月22日,阜阳市 "金种子" 杯第二届盆景精品展开幕式在...

  • 种子计划月总结。

    时间过得真快,第四期种子计划又要毕业了,和第三期比起来轻松了许多。学过的软件能够运用自如,在这期又学到新的软件简拼...

  • 种子力量学习总结

    正威国际集团2014年《财富》世界500强排名295位,以下是文总的学习总结,本是word文档,分享不便,故简书承...

  • 种子计划总结 2019.8.20

    种子计划结束了。 几乎每一次去Innospace都让我很期待。已经很久没有与一群真正为你好的导师们面对面交流了。 ...

网友评论

      本文标题:种子杯总结

      本文链接:https://www.haomeiwen.com/subject/fagdxqtx.html