有意思的CITEseq文库结构。
理解CITEseq的文库结构,有助于在分析数据的过程中更好地troubleshooting.
首先来看CITEseq文库结构图,我标注了一些信息在上面:如下图
image.png我们来看看cell barcode在read1中的位置为前16bp, 然后紧接着跟了10bp的UMI,然后是13bp的TTTCTTATATGGG固定序列+ 9bp的随机序列N + 15bp Antibody barcode的反向互补序列 + 10bp随机序列N + 34bp Read 2N + 8bp sample index + P7
image.pngps: 从34bpRead2N开始到p7结束这些完全是多余的.
再来看read2 : 10bp 的随机序列N + 15bp antibody barcode + 9bp N + 13bp固定序列 + 10bp UMI + 16bp cell barcode + read1 + p5.
image.pngPS:是从文库结构图的P7到P5方向测过来的。
稍微解释一下:
在图read1结构中的15bp Antibody barcode序列为:TTAATGTCGTCCGGC,它的反向互补序列为:GCCGGACGACATTAA , 正是IgG1的Antibody barcode序列(如下图配置文件).
image.png总结:
采用PE150这样的测序方式,会在read1和read2中重复测很多不必要的序列,有点浪费,其实SE100完全满足这样的文库, 但目前illumina只提供最少PE150的测序方案, 这也是最便宜的方案了. 就只能这样用。
网友评论