我在做BreakPoint Motif分析时,提取每个read在参考基因上的比对位置,一开始我认为read的比对位置不可能有比对到染色体的第一个碱基的,因为染色体结构的复杂性,染色体的两端有高度螺旋化的端粒结构,染色体的开始一串基本都是NNNNNNNN。

然后发现我错了啊啊啊啊啊:

看了所有的染色体,好像只有17号染色体的第一个碱基开始都被测序出来了,那它有什么特殊的吗?
简单搜了一下:
ref:https://zhuanlan.zhihu.com/p/635612574

ref:https://www.nsfc.gov.cn/publish/portal0/tab440/info59391.htm

当然,我用的参考基因组版本为hg19~
网友评论