前面推文已经把家族基因的成员确定了,现在对这些成员做一些基本的分析,包括1.理化性质分析、亲/疏水性,有无信号肽/跨膜结构域和亚细胞定位。做成表格,其他分析大都图片形式)2.基因染色体分布情况3.基因结构分析(外显子内含子分布及数量)、基序分布和保守结构域分析(与确定家族成员重复,可视化更为直观,如果家族基因数量不多可以把两张图合并)。
1. 基因家族成员基本分析:A.理化性质的分析(分子量,等电点,不稳定指数,总平均亲水性,脂肪指数等,根据自己分析需要整理)B.亲疏水性 C.跨膜区分析 D.信号肽预测 E.亚细胞定位
B.https://web.expasy.org/protparam/ (在理化性质的结果页面GRAVY数值显示,预测蛋白质中所有氨基酸的亲水性值总和÷氨基酸残基数量)。
https://web.expasy.org/protscale/(结果图片形式显示,纵坐标Score,大于0表示疏水性,小于0表示亲水性)。
C.http://www.cbs.dtu.dk/services/TMHMM/(结果页面Number of predicted TMHs数值显示有几个,包括具体信息附有图片)
D.https://services.healthtech.dtu.dk/service.php?SignalP(结果页面Prediction: Other)
E.http://cello.life.nctu.edu.tw/cgi/main.cgi(结果页面显示CELLO Prediction不同数值显示)
2.基因染色体分布情况(简单来说,栽培花生有20条染色体,基因家族成员在这些染色体上分布是否位于两端?每条染色体上的数目是否一样,哪条染色体上基因家族成员的数量最多/少?)
(1)Graphics→Show Genes on Chromosome→Gene Location Visualize from GTF/GFF→拖入基因组注释文件(.gff3/.gtf)和所有基因家族成员的基因ID(串联重复基因有也可显示)
(2)每条染色体上家族成员的数量可自行统计做图,看对文章分析的重要和完整性而定
3.基因结构分析、基序和保守结构域分析(如果基因家族成员不多,基因结构,基序和保守结构域和进化树可以合并可视化,从而对家族成员的鉴定进行再次确认)
(1)Graphics→Bio Sequence Structure Illustrator→Gene Structure View(Advanced)→拖入相应准备的文件,右侧参数可以自行设置与摸索(根据自己分析需求选择单一或整合模块)。
需要准备相应文件:A.基因组注释文件(显示基因结构分布)B.进化树的树文本文件(MEGA进行多序列比对后保存)C. MEME网站预测直接保存的基序分布文件mast.xml D. 保守结构域文本文件需要自行整理(包含基因ID、起始位置、结束位置和结构域名称Gene/From/To/Short name)
家族成员基本性质的分析涉及的图片较多,保存时尽量选择高分辨率以上(本人投稿杂志社要求彩图在600dpi以上),不然返图确实很麻烦。
网友评论