美文网首页
毕业论文

毕业论文

作者: 操控者 | 来源:发表于2020-01-17 11:13 被阅读0次

PTM/Processing 提供蛋白质翻译后修饰或翻译后加工的相关信息。

expression 提供了基因在mrna  水平上的表达信息,或者在细胞中蛋白质水平上的表达信息,或者在不同器官组织中的表达信息。

interaction 提供了蛋白质之间相互作用的信息。

structure 提供蛋白质二级和三级结构信息。

family domains 提供蛋白质及结构域信息。

sequence 序列信息,,,异构体,可下载

PDB文件,文本文件,3D结构

Pfam 数据库是一个蛋白质结构域家族的集合。识别出蛋白质中的结构域对于了解蛋白质的功能有重要意义。search来匹配结构域。

CATH重要的蛋白质结构分类数据库。蛋白质被分为四种,C A T B 。

SCOP也是蛋白质结构分类数据库,但SCOP注重蛋白质进化方面的分类。(搜索PDB结构)

专用数据库,KEGG 简称京都基因组百科全书。代谢通路。每个点代表一个化合物,连线代表反应。

序列比对,,,替换记分矩阵(Substitution Matrix): 反应残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。分为DNA替换记分矩阵和蛋白质替换记分矩阵。

比较序列相似度:打点法:对角线及对角线的平行线都是相似序列。。。在线打点器可能需要安装java

序列比对法:Needleman-Wunsch算法。

在线双序列比对,  EMBL-EBI 

输入fast格式文件。gap open(gap开头)  gap extend(gap 延长)一般设置开头分高,延长分低。这种设置的缘由是在连续的序列里,打开一个口子的代价大。

如果有不同的预期,如下两种情况:

1,要比对的序列相似,期中一条结构已知,比对,

2,绝大部分相似,但期中一个的功能区序列缺失了。

全局比对中比对不好的在局部比对中被省略。(有时,序列并不同源,只是有相似的功能区,这时最好用局部序列比对。)

BLAST(Basic Local Alignment Search Tool):快速在数据库中寻找相似序列。用一条序列,与数据库中所有的序列一一进行双序列比对,寻找相似序列。

BLAST 原理是找片段对。

Blastx 将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库(因为并不知从那个碱基开始翻译,索性把三种情况都试一遍,因为核算序列有可能是互补链,所以有6种,而不是3种)。这样做的原因是核酸序列库和蛋白质序列库并不全面,或者有时需要的本来就是蛋白质序列。

blast虽然速度快,但牺牲了精确度,不会落下高度相似的序列,但相似度低的会被落下。这时可以选择PSI BLAST(标黄的搜索是新搜到的序列,下一轮搜索会作为比对序列来搜索。)

PHI-BLAST 用正则表达式来搜索。

smartblast 精确,懒人专用,直接输入序列。

多序列比对:找功能区,见电脑储存图片

多序列比对结果,一列全部相同底下一个*,若大致相似,有相似的,亲疏水性,大小相似则:  有不想似的则.  若完全不同则无。

在EMBL-EBI 的Clustal Omega 里比对完后,点Result Summary 选择Percent identity Matrix 可以查看各个序列间的相似度。

TCOFFEE  多序列比对。

jalview  比对结果修饰(重点)http:/www.jalview.org

多序列比对,寻找重要位点,保守区域。

序列标识图

MEME 帮助我们寻找序列中的特定片段,也可以对找到的特定片段搜索数据库。

PRINTS 蛋白质指纹图谱数据库。(蛋白质重要基序,可以查看3维结构。)重点。可以搜索相似蛋白。

研究进化,最确凿的证据,生物化石,解剖

分子进化。

系统发生树,有根,无根

构建系统发生树需要两个软件对比。

MEGA  要构建更好的系统发生树,必须学会至少3个参数的设置:test of phylogeny :

No. of bootstrap Replication(步长检验):(检验次数)  在每个节点出都会有一个百分数,指定次数次计算所得出的系统发生树中,有百分之多少棵树中有这一节点。一般绝大多数节点上的数值大于百分之70的树才可信。

Substitution Model(计算遗传距离时使用的计算模型) 

Gaps/Missing Date Treatment (删除多序列比对中含有空位的链)

Original Tree 是原始检验中其中的一棵树(树枝长度可以精确代表遗传距离。), Bootstrap consensus tree 是合并后的结果。

蛋白质结构预测与分析。

一级结构,氨基酸序列

二级结构,周期性的结构构象:DSSP文件

PDB网站获取蛋白质二级结构,输入PDB ID

预测蛋白质二级结构网站:PSIPRED

三级结构,整条多肽链的三维空间结构

四级结构,多个亚基形成的复合体结构

今天用licorice whole genome关键词搜索NCBI数据库,搜到了abrus precatorius,貌似是什么相思豆,土甘草,不管了,搜不到甘草的全基因组。用关键词                          self-incompatibility搜了自交不亲和基因。

相关文章

网友评论

      本文标题:毕业论文

      本文链接:https://www.haomeiwen.com/subject/pilczctx.html