1、数据库
taip拟南芥,rapdb水稻数据库,ngdc国内组学数据库,ena下载速度比ncbi快,ddbj日本数据库没人用,Swissmodel蛋白结构同源模型服务
2、系统发育树及构建方法
系统发生哪个先有哪个后有
系统发生树就是一种聚类就是一种常见机器学习的方法,数据类型:表型特征,分子标记,snp
构建算法,基于距离特征
常用软件mega
3、功能注释,
看生物学功能两种方法
基于同源性做BLAST
通过从头预测蛋白功能域
蛋白功能在线分析数据
4、数据可视化:热图
excel用单元格式三个分号可以隐藏数字,条件格式可以画简单的热图,只适合不做聚类的
R中alpha透明度
序列联配扣分太多是因为两个碱基突变比较大所以负分很多
基因组序列测了没有太大价值,只有注释出真正的基因才能找出功能
tss转录起始位点,具体每一段外显子序列什么的
网友评论