现有区间如上,需要统计各区间内的SNP个数 (示例文件中的Chr文件)
公司返还的,或者说从hmp等格式上截取下来的之后SNP位点,例如下图
image.png
由重测序或者大芯片的行数过多,无法在excel上进行操作
现采用R的For循环进行简单的汇总统计
for (i in 1:nrow(Chr)) #循环次数为Chr文件的总行数
{
chrosmome<-Chr[i,1]
start<-Chr[i,2]
end<-Chr[i,3] #获取3个定义的值
huizong[i,1]<-chrosmome
huizong[i,2]<- start
huizong[i,3]<- end #赋值到新表
huizong[i,4]<-nrow(dplyr::filter(SNP,X.CHROM==chrosmome,between(POS,start,end))) #筛选符合条件的SNP
}
网友评论