1.材料:黄瓜砧木(南瓜砧木),西瓜接穗(黄瓜接穗),自根西瓜(自根黄瓜)
2.鉴定策略:
-
1.西瓜接穗比对到西瓜基因组,Tohat2 (猜测当时hisat2还没在线)允许两个编辑距离,即使是一端比对上也认为这对reads比对上
-
2.剩下没比对上的reads与自根西瓜的RNA-seq reads比较,完美符合的舍去(ps:无自根材料,有人用的cDNA)。
-
3.进一步剩下的reads比对到黄瓜基因组上,允许一个编辑距离。只有双端比对上才被认为是比对上。
-
4.鉴定移动的mRNA:至少两个生物学重复中reads>=2或5
-
5.西瓜和黄瓜序列一致性>98%,并且长度大于>=100bp。(覆盖)
-
排除:
黄瓜和西瓜的CDS进行blast,鉴定到150个黄瓜基因含有这样的区域。除去这些gene也不影响分析。
3.编辑距离:
https://www.cnblogs.com/leezx/p/5978014.html
4.难点及思考(可能有错误,待实践):
1.编辑距离的控制:
- 根据sam文件第六列CIGAR:简要比对信息表达式(Compact Idiosyncratic Gapped Alignment Report)筛选结果。
2.一个reads匹配和两个reads匹配怎么区分?
- hisat2比对上指的两端和一端比对上的总和,那么只需要双端比对上的怎么做?
3.与自根材料的比较,什么叫完美符合?
- 将RNAseq变成fasta,再来比对。完美???有点不明白为什么要跟自根的比。。。
5.文献出处:
Zhang Z , Zheng Y , Ham B K , et al. Vascular-mediated signalling involved in early phosphate stress response in plants[J]. Nature Plants, 2016, 2(4):16033.
网友评论