美文网首页
序列数据库

序列数据库

作者: 医学小咖成长之路 | 来源:发表于2018-06-25 10:21 被阅读0次

Genbank

GenBank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库.GenBank与EMBL(欧洲EMBL-DNA数据库)、DDBJ (日本DNA数据库:DNA Data Bank of Japan)建立了相互交换数据的合作关系,所以在其中任何一个数据库检索的结果基本一致。

基本检索功能

限定词检索:限定词是在名词词组中对名词中心词起特指、类指以及表示确定数量和非确定数量等限定作用的词类。

标识符检索:是指用来标识某个实体的一个或一列符号。

范围检索:时间、序列长度、序列号等的范围。

高级检索:各种自带的限定词。

序列比对

Blast,全称 Basic Local Alignment Search Tool,即"基于局部比对算法的搜索工具 "。Blast 能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对 比对区域进行打分以确定同源性的高低。

工作流程:

1、利用目标序列(subject)建立数据库

2、待查序列(query)在数据库中进行搜索

3、每一条query和每一条subject进行双序列比对,获取比对结果

Blast是一个集成包,主要包括5个比对模块,实现5种序列比对方式:

blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。

blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。

blastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列,然后再与蛋白库做比对。

tblastn:蛋白序列对核酸库的比对,将库中的核酸翻译成蛋白序列,然后进行比对。

tblastx:核酸序列对核酸库蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后对蛋白序列进行比对。

UCSC Genome Browser

由University of California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具。

序列比对

Blat,全称 The BLAST- Like Alignment Tool,可以称为"类 BLAST 比对工具"

Blast与Blat的比较

Blast 相对于Blat有几个缺陷:速度偏慢、结果难于处理、无法表示出包含 intron 的基因定位。Blat 就是在这种形势下应运而生了。Blat 的主要特点就是:速 度快,共线性输出结果简单易读。对于比较小的序列(如 cDNA等)对大基因组的比对,blat 无 疑是首选。Blat 把相关的呈共线性的比对结果连接成为更大的比对结果,从中也可以很容易的找到 exons 和 introns。因此,在相近物种的基因同源性分析和EST 分析中,blat 得到了广 泛的应用。

GEO数据库

Geo(Gene Expression Omnibus): is a public functional genomics data repository supporting MIAME-compliant data submissions. Array- and sequence-based data are accepted.。

主数据库中的记录种类:平台、样本、系列、补充文件、数据集、表达谱

GEO有三种供提交者提交数据的平台,分别是Platform、Samples、Series。

Platform用来提交对序列及基于序列的平台的描述。Samples用来提交样本的处理条件、丰度测量方式。一条Series将一组相关Samples连接在一起,并提供了整个研究的描述,包括对数据的描述,总结分析。

Datasets是由GEO工作人员将Series数据整理所得,可以被可视化和分析,代表了生物学和统计学上可以被比较的样本的集合。而Profiles来源于Datasets,由在Datasets中所有样品的单个基因的表达测量结果组成。

相关文章

  • 二级核酸数据库

    RefSeq 数据库 参考序列数据库通过自动及人工精选出的非冗余数据库,包括基因组序列,转录序列和蛋白质序列。 d...

  • influxdb

    前言 influxdb是目前比较流行的时间序列数据库。 何谓时间序列数据库?什么是时间序列数据库,最简单的定义就是...

  • BLAST分类

    BLASTn:用核酸序列搜索核酸序列数据库 BLASTx:将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库...

  • pg数据库增加自增序列和对已有数据插入自增值

    pg数据库增加自增序列和对已有数据插入自增值 pg数据库增加自增序列 pg数据库增加自增序列步骤: 或者创建数据库...

  • 一级蛋白质数据库

    蛋白质序列数据库 三大数据库共同构建蛋白质序列数据库——uniprot 数据库 Uniprot 数据库 unipr...

  • 2021-09-30 数据库记录格式

    分子序列数据库主要分为初级数据库和二级数据库。初级数据库包括了核苷酸序列,蛋白质序列和蛋白质结构数据库,二级数据库...

  • 基于序列分析的m6A数据库汇总

    基于序列分析的数据库简介 基于基因序列来进行预测的数据库,一般的输入文件都是序列文件。序列文件的话一般都是 fas...

  • 201023:Oracle数据库中创建序列-Oracle触发器写

    一. Oracle数据库中创建序列 序列(sequence)就是所谓的序列号,每次取的时候它会自动增加。 创建序列...

  • 【数据库】本地KEGG数据库如何拆分子库?

    根据相似性原理,序列相似,功能相似,所有功能注释无非是用比对工具将输入序列比对到数据库序列,再将输入ID对应数据库...

  • miRNA分析中常用的数据库

    一、miRBase数据库 miRBase序列数据库是一个提供包括miRNA序列数据、注释、预测基因靶标等信息的全方...

网友评论

      本文标题:序列数据库

      本文链接:https://www.haomeiwen.com/subject/wxtsyftx.html