去年年末的时候,一次偶然机会回学校合作一个项目,发现我的老师自己在学习R绘图。
我们是一个比较小的实验室,经费和人员都比较紧张,学生大多是硕士三年制,流动性也很大,所以实验结果分析这块的主要内容是老师自己完成的。
聊天的时候,老师说实验室现在还在用我之前随手丢给师弟师妹的一个绘制热图的脚本,但是不知道怎么去修改图片的细节。我突然感觉很汗颜。
毕业三年了,一直在从事生信相关工作。
自己平时也偶尔会写一些东西,但是都没有坚持下去。
可能在公司内部分享会比较多,不过那更多是因为有月度考核。
我一直感觉目前正在进行再一次的科研迭代,迭代对象就是生物信息。
只不过这一次迭代的过程有些痛苦,毕竟学生物的女生比较多,而大部分女生对计算机不是特别有兴趣。
之前在给外部客户培训时候,我经常说,没有必要学习那么多生信技能,你需要的生信知识是根据你所在实验室的定位决定的!绝大部分分子实验室,学会文本操作和绘图就差不多了。
其余的东西,例如差异分析原理、转录组分析流程等等,简单了解一下就可以了。毕竟现在科研服务这么便宜,交给公司做的性价比更高,毕竟大部分实验室每年只能招收1-2个新学生,根本没有人手和精力去学习和搭建一套新的分析体系。
而且说实话,生信的工资并不是那么高。现在薪酬最好的是去做博后,所以热爱科研的小伙伴们,专心做好自己课题才是最好的选择。不要过多地被外界事务所迷惑。
所以现在想将自己这些年学习和工作所获,撰写出来,帮助实验室快速度过此次科研迭代。
这个专栏的内容目前设计主要包括两个内容:
1.文本操作
生信的基础分析部分,一般交给公司或者其他合作实验室来完成就行。
但是在拿到基本结果后,例如差异基因,如何快速定位到自己感兴趣的目标;或者自己看文献时候发现一些有意思的数据库,想要看看是否可以关联到自己的结果。这个才是和大多数科研人员密切相关的。
这个时候,如果懂得一些基本的编程,可以很方便的去完成这些事情。
当然在excel里面也可以做,但是过于耗费精力,可操作性不大。
2.绘图
在公司工作这几年,接到客户后续分析需求中最大的一部分就是绘图了。
懂得绘图技术的话,可以更深入的去挖掘基础结果;而且在投文章时候,不同期刊对于图片的展示都不一样。
这些工作如果想要依赖他人的话,太耽误自己的时间了。
所以基于上面两点,我选择R作为这个专题的内容。
选择R作为生信语言,限制其实是很大的,我自己的主语言是python。
但是如果只是想要处理上述内容的话,懂R就够了。否则又要学习python,还要学习R,学习成本太高了。
最主要的是,R里面有一个ggplot2包,绘图首推,几乎可以满足80%的绘图需求。再简单学习一些其他常用的绘图包,例如绘制热图的pheatmap、绘制韦恩图的Venn等,基本上就齐全了。
########################################################
其实本来是想着自己先把该弄的全部写完后,再发出来。
但自己实在是有些懒惰,从过年时候就开始写这个专栏的内容,到今天也就写好前两章内容。总是被其他事情耽误,其实都是借口。
所以一发狠,今天就发出来,并且推送给实验室的老师,逼自己快些写完。
对自己狠才是真的狠人,所以,你们最好都不要惹我~~~哈哈哈!!!
########################################################
网友评论