基于深度学习的序列模型预测非编码区变异的功能效应

作者: 黄树嘉 | 来源:发表于2017-06-25 11:26 被阅读83次

基于深度学习的序列模型预测非编码区变异的功能效应
时序预测
使用亚马逊的DEEPAR做股票的预测
GSM-cobra-python
时间序列分析
Java调用Keras、Tensorflow模型
Prophet 时间序列预测工具
深度学习信用评分卡模型
重复问题检测
真核生物基因结构图（外显子、内含子、mRNA、CDS区别）

cover

[注] 本文同时发于泛基因fungenomics公众号和我的个人博客。

Deep Learning，现在几乎到处都能看到它的应用。看！紧随DeepBind，在基因组学应用中又来了一个DeepSEA——这是一个适用于表观遗传研究和应用的工具，它只从DNA序列出发，并没用其他有关于表观研究的实验或者测序技术，通过直接输入fasta sequence，vcf或者bed文件，就可以预测转录因子结合位点(Transcription factors binding site), DNase I超敏感位点（DNase I hypersensitive sites）和组蛋白靶点（histone marks），这么多年来，这样的做法还是头一回。下面这张示意图展示的是各个主要的表观修饰在染色体中的位置和相关实验测定技术。

EPI

为什么要有这么个东西呢？

众所周知，人类基因组上绝大部分的序列都是非编码序列——不直接编码蛋白质的序列，这些序列在很长的一段时间里都被误解为所谓的“垃圾DNA”！但其实它们各自都有着独特的作用——调控着机体的正常运作，只是要想正确地理解它们确实不是一个容易的事情。DeepSEA想要干的就是尝试从序列的基础功能预测着手去解决这么一个难题。

deepsea

它先通过学习大量已知的染色质修饰数据——主要来自于ENCODE和Roadmap Epigenomics等大型项目，经过不断的训练，学习到了许多种在非编码区域中序列调控的序列模式或者说是序列特征（注意是序列模式，不是功能模式），之后，便可以通过这些模式和特征去预测序列上单碱基的突变会如何影响染色质的修饰功能。从发表的文章来看，其精确程度是目前所有方案中最高也是在同等数据下最有效的了。

DeepSEA 在Nature Method的原文http://www.nature.com/nmeth/journal/v12/n10/full/nmeth.3547.html
更赞的是它的代码和相关训练数据都一起公开在网站上：http://deepsea.princeton.edu/ 可以尝试玩起来了。

欢迎通过我的公众号（解螺旋的矿工），更及时了解更多信息

解螺旋的矿工

基于深度学习的序列模型预测非编码区变异的功能效应
[注] 本文同时发于泛基因fungenomics公众号和我的个人博客。 Deep Learning，现在几乎到处都...
时序预测
MeteoAI | 张琦的深度学习与气象时序预测【时空序列预测第三篇】时空序列预测模型之PredRNN（用ST-...
使用亚马逊的DEEPAR做股票的预测
DeepAR 是 Amazon 于 2017 年提出的基于深度学习的时间序列预测方法，目前已集成到 Amazon ...
GSM-cobra-python
在本章中，我们将阐述一个研究细菌物种基因组变异的方案，通过基于约束的代谢模型预测表型差异。材料基因组序列通过...
时间序列分析
趋势,平稳时间序列模型,非平稳时间序列模型,模型识别,模型估计,参数估计,模型诊断,预测,季节模型,时间序...
Java调用Keras、Tensorflow模型
实现python离线训练模型，Java在线预测部署。查看原文目前深度学习主流使用python训练自己的模型，有非...
Prophet 时间序列预测工具
Facebook有一套开源的时间序列的预测工具。Prophet是一个预测时间序列数据的模型。它基于一个自加性模型...
深度学习信用评分卡模型
深度学习模型概述深度学习网络用于违约预测
重复问题检测
1.基于序列到序列模型的句子级复述生成 2.深度学习之《社交网络问答系统-问题重复检测任务》实现
真核生物基因结构图（外显子、内含子、mRNA、CDS区别）
1. 基因DNA分为编码区和非编码区，编码区包含外显子和内含子，一般非编码区具有基因表达的调控功能，如启动子在非编...