Human Splicing Finder: an online bioinformatics tool to predict splicing signals阅读笔记
介绍:HSF在BPP的文章中被描述为‘’HSF is an online bioinformatics tool to predict the effects of mutations on splicing signals (Desmet et al., 2009). It can identify BPS based on a position weight matrix (PWM) from the consensus sequence YNYCRA Y . However, the lack of a standalone version limits its wider application.‘’
1这段主要是讲使用位置权重模型进行预测,并非机器学习的方法。我感兴趣的是:1.它可以对突变影响作出预测,这个不知道机器学习能否做到2.PWM也是我最先考虑的方法,但是设计难度要更高,更依赖专家知识,既往经验去设计。比起机器学习的学习方式,可能会失去一些新发现。但是对既往的数据表现应该更好。
LaBranchoR阅读笔记
2本段:主要采用的方法是LSTM的机器学习方法,RNN和一维卷积神经网络是处理序列、文本文件的有利手段。本文采用Keras平台作为机器学习的实现基础,其中的一些处理手段都是机器学习的常见手段。
问题:1.是否采用相似的方法去做机器学习,如果相似创新点在哪里。2.安装keras 3.本文还就SNP、突变影响有一些处理,在我们的方法里,这部分该如何解决。HSF中提出的解决办法似乎未必能成立。
CIRI文章阅读笔记
2
流程中的两次比对和我的方法很像,这种从头识别的方法应该都比较相似,都是先用CIGAR筛选,再做二次筛选。主要是用位置信息和双端测序的信息去鉴别,缺点是本文落脚点在identification,并不进行预测。但是鉴别时候利用的双端信息很有启发,准备加入进我的方法。二次筛选使用的动态规划法,可以考虑借鉴。
网友评论