——本科毕业设计,初次邂逅深度学习与神经网络
我期待在这最后一课上有所成,有所获,并坚定的相信自己能够出色的完成任务。
毕业设计的课题是冯老师给我指定的,我自己没有什么好挑的,遇神杀神,遇佛杀佛,不管做什么,只要自己认真投入,定会有所收获,最终的成果也不会差到哪儿去。
当我看到课题名称《基于深度学习的中文分词研究与实现》的时候,我脑海里的反应大抵就只有“自然语言处理”六个字,并不知道中文分词是干什么的,也没有深度学习的技术基础,但一点也不排斥。之前其实对深度学习挺感兴趣的,但可惜研究生阶段不能进行相关的研究,正好这次毕业设计给了我一个了解它的机会。
![](https://img.haomeiwen.com/i4673196/80b72462ba59462d.png)
毕业设计从一月初下达任务书,到五月底检查答辩,说来理论上也有五个月的时间,但事实往往都是从三月进行到五月的,但由于之前合肥的实习,我毕设的实际进行时间就只有两个月。
我在庆幸这在两个月里,我每天都在微博上打卡,记录每天的工作、遇到的问题、项目的进度等。现在回想,两个月的历程历历在目。
3月底回重庆,时间刚好允许在3月30日之前把开题报告提交上去。
4月初开始《零基础入门深度学习》的学习,认认真真地写下了好厚一塌学习笔记。内容虽简,但易于理解和掌握。
清明节浪了一圈回来之后,内心惭愧与紧迫,深夜写语料的预处理。虽然那些处理结果后来都没有用上(因为后续处理方案的调整,前面的语料也需要对应的进行重新处理),但通过这么一波瞎操作,我重试了对python的使用能力。
后来导师说我时间紧,进度要加紧赶上,不要再慢条斯理的学什么理论了,赶紧把环境搭好,码起来吧。于是我就一连串的pip install……,然而遇到的问题特别多,pip源、版本、sip等,折腾了不少时间。
环境搭好了,初步模型也跑起来了,这个时候是4月中旬,我便开始不慌不忙地带我灰写前端。
4月下旬又一次打开了word,开始做译文工作,随后又花了两三天的时间扎到了keras中文文档的学习中……
5月开始写项目demo,前端写得所向披靡,设计图都不用画,想写成什么样,就什么样!不过以前接触的都是javaweb项目,pythonweb还是第一次。会写web前端的我,会写python后端的我,就是还不知道怎么把前后端连起来,于是百度一发,flask框架就出来了。但在flask框架里面调用keras神经网络有一个巨大的坑在等着我,这也迫使我去了解了TensorFlow后端的一些原理。
后面的日子就是一边调参训练模型,一边写我的demo,每天脑海里都有一个非常强烈的念头:我要换电脑! 以至于逛京东,看到i7和16G就会流口水~ 逐渐非常深刻地意识到,科研是需要经费的!
我的Sunpart(demo命名)一天一天的成长,界面越来越友好,功能越来越全面,我也开始带我灰写起了js……
五月十日起,我自认对整个项目有个统筹的了解之后,痛下决心,开始了二次设计和开发,规范了语言编码,重新对语料进行了预处理,对模型结构和参数都进行了调整,整个项目一下子就规范而清晰了起来。 接下来的工作主要就是计算机的事儿了,过程总共输出模型25个(感觉电脑都被烧坏了)。
十四日起开始了毕业论文的撰写,又是发挥强项的时候了,语言组织能力太强,从来不担心字数不够,开开心心的码字,开开心心的画图。二十五日论文的故事以查重率8%剧终了。
答辩是在六月七号,至此之前,除了精心准备一份PPT,还恶补了课题的理论知识。真是纸上得来终觉浅,绝知此事要躬行啊,这次再回头看原理,很多东西都自然而然的清晰明了了,对整个课题的研究也多了很多自己的看法和见解,如果有时间的话,想必还会尝试更多的方案来提升模型整体的分词效果。
最后我最满意的成绩不是拿到优秀,而是我自己的讲台上的表现,如此,才算是大学一个圆满的句号!
————————————————————————————
原文发表于夏木青 | JoselynZhao Blog,欢迎访问博文原文
—————————————————————————————
网友评论