因为CIDP需要目的序列,对于没有生信基础的同学来说从基因组提取序列是一个相对痛苦的过程。所以给同学们设置了序列提取模块。请同学们进行软件安装以及命名文件夹和文件的时候避免使用空格,如果有空格在这些路径里会报错!在CIDP安装后,在它的安装位置会有一个example文件夹,这里面是示例文件,希望同学们在操作前先用示例文件跑一下。
在①放入基因组序列文件;在②放入gff文件(如果没有gff文件有两种解决办法,一个是利用下面的“format gff/gtf file” 功能将gtf文件转换到gff文件;如果gtf文件也没有,可以自己做一个基因的位置文件,文件的格式是基因ID,Chr/scaffold/contig ID,起始位置,终止位置,正/负链,然后一行一个,将位置文件放入③,然后点击“extraction based on the infor file”)。将需要提取的基因的ID放到⑤(如果只想提取一个就直接放入ID就好。同时需要注意这里所说的ID是指gff文件中mRNA那一行对应的ID,如下图所示),然后在⑥设置存储位置并命名文件(如果是想提取启动子,需要在⑦设置启动子长度,默认为2000,一般够用),然后根据自身需要点击下方按钮即可以。在不清楚时,可以看到在每个框的后面有一个带着数字的文件夹图标,对应的,在功能按钮上也有相应数字,例如第一个按钮“extract promoters” 后面标记的是1,2,5,6,则指的是用户需要根据1,2,5,6文件夹图标,然后在相应位置放入相应文件或者信息。
网友评论