DNAcopy包主要用于分析测量DNA 拷贝数的芯片数据(Comparative Genomic Hybridization (array CGH) data).其原理主要是寻找数据定量后的断点,断点后的基因组丰度相较于对照组的比率与断点前发生显著变化。断点对应于潜在DNA拷贝数发生变化的位置,可以用来识别拷贝数变化的区域。
# 分析实例
##数据
在Snijders et al. (2001)中选取了一个数据集,命名为coriell;数据中包含两个CGH数据集。下面实例使用数据GM05296。
##实例分析
library(DNAcopy)
data(coriell)
将数据转换为CNA对象
CNA.object <- CNA(cbind(coriell$Coriell.05296),
coriell$Chromosome,coriell$Position,
data.type="logratio",sampleid="c05296")
分析之前,可以对单点异常值进行平滑拟合一下。
smoothed.CNA.object <- smooth.CNA(CNA.object)
然后进行segmentation
segment.smoothed.CNA.object <- segment(smoothed.CNA.object, verbose=1)
Analyzing: c05296
画图
plot(segment.smoothed.CNA.object, plot.type="w")
image.png
plot(segment.smoothed.CNA.object, plot.type="s")
image.png
plot(segment.smoothed.CNA.object, plot.type="p")
image.png
sdundo.CNA.object <- segment(smoothed.CNA.object,
undo.splits="sdundo",
undo.SD=3,verbose=1)
Analyzing: c05296
plot(sdundo.CNA.object,plot.type="s")
image.png
网友评论