27岁这一年,我开始学生信
2017年,硕士入学,虽然当时月薪3000,我花了2000左右,在丁香园买了个科研课程中,虽然什么都没学会,但是邂逅了“生物信息学”和“R语言”这两个概念,就很值得。我当时就知道它们很重要,我一定要学会,可惜当时的我还没遇到生信技能树。当然,如果真遇到了,我可能也不会有现在这般的热情去学习它。所谓“知耻而后勇”,人只有受到足够大的刺激才能迸发出足够的激情。
虽然我不记仇,但是尴尬和难堪的记忆总是最深刻的,也是最能激励人奋进的。第一次去打听测序这件事,是因为研一时被硕士导师安排写PDX模型相关的综述,结果文章看多了,和PDX模型最相关的“肿瘤精准治疗”就吸引了我的注意力,从此,所有的科研想法就聚焦在这个理念上。于是经过校友介绍,认识了一些做测序的公司,一问价格,都是1例样本数万元起步,最后还来一句:“没钱做什么测序啊?”第一学期完成硕士课程后,就开始上临床干活,同时养细胞,只有偶尔失眠时爬起来打开RStudio,一知半解地完成一个列线图的教程,直到东方既白,右下角终于出了个很丑的图,把自己感动得热泪盈眶。等我需要开始做课题时,蹭着热点,做了MeRIP-seq和RNA-seq,等结果出来后,想画一张热图,有人说,“需要几千块一张”。有人说,“我们忙得要死,这么简单的图还是请客户自己画吧”。于是在我网上疯狂搜教程,用Excel画,用网页小工具等等,天天学,天天试,学得太专注,还毁掉我一段感情,结果却还是不理想。幸好这时遇到个靠谱的朋友,帮我完成了画图这项工作,才一起发表文章并考上博士,是幸运协助导师中了个面上项目,硕士圆满毕业。
2020年,博士入学的前一天,我给自己列了许多任务,第一项就是学会R语言和生信分析。可是,自学实在太不容易,一看书就困,漫无目的地做练习题就觉得浪费了我看文献的时间,思绪来回拉扯,无比纠结。某一天,不知在哪里收到一条讯息:“Hitplot”在线数据分析平台要开发布会。我迫不及待去听了,发现这些工具的开发者居然都是全国各大医院的医学生。在感受到巨大差距后,我很失落,同时也很振奋。我当时产生一个想法,“未来医学科研工作者会分为两类,老一辈的凭借深厚的知识底蕴,知道该做什么样的研究,年轻一辈通过大数据分析,机器学习等方法,才能知道做什么方向更好。”于是,借着免修英语的空挡,我去蹭了给硕士开的生物信息学课程。虽然能学到不少基础知识,但是仍然缺乏R语言实操。
转折点出在偶然间和室友聊起生信分析,他说这个不难,B站上有很多教程。于是,我第一次上了B站,第一次看到了生信技能树的免费视频。但也只是看了一点点,因为我总觉得免费的东西估计作用不大。幸运的是,我关注了这个公众号。之后就是按部就班地上完博士课程,看文献,想把硕士期间发现的东西延续着做一做,偶尔艰难地推进R语言的学习。直到完成期末考后的某一天,我在生信技能树上看到一条“数据挖掘培训”的推送,就像遇到了命中注定的那个人一样,仅仅只看完标题,我就马上给博士导师发消息,请求暂时不要拉我回临床,给我2个月时间,让我把这个课程学完。导师让我再好好考虑一下,这个课程是否真的值得学习。我回答说:“不用再考虑了,我等这样的课程已经等3年了。”
实在感谢导师的信任,不仅给我时间,还报销了课程报名费。于是,我从2021年1月份开始听课,终于如愿以偿,下载到了我想研究的数据集。之后,我给自己配了台式机,除非吃饭或者偶尔的临床任务,其余所有时间,我都是坐着或者站着电脑前看教程,改代码,再看教程。直到2021年12月份,我已经完成2篇文章的分析,目前等待着验证结果,也借此完成了博士开题。目前,我认为转录组水平的分析,只要是R语言能完成的,通过各种教程的学习,都能实现,只是所需的时间长短不一而已。另外,我也不会满足于此。我还在进一步学习RNA-seq上游分析以及DNA层面的大数据分析,希望同时学好Lunix和Python,以进行更大规模和更高级的数据挖掘。
结合自己前期的科研经历,我希望在未来能以大数据分析为基础,结合分子生物学技术、计算机辅助药物以及复合生物材料,建立一个完整的研究体系,从临床问题出发,逐步探究恶性肿瘤这一世纪难题。虽然现在还没有太多经费,但是感觉自己有方向,不迷茫,每天叫自己起床的都是“希望”。再次感谢导师,感谢健明老师、小洁老师以及生信技能树全体成员。
2021年12月23日星期四
写于27岁生日前一天
网友评论