美文网首页生信笔记
indrop数据分析

indrop数据分析

作者: 11的雾 | 来源:发表于2018-09-04 16:05 被阅读25次

软件:https://github.com/indrops/indrops

第一步先将软件下载下来,采用git clone https://github.com/indrops/indrops.git
根据说明先装requires,python,RSEM,bowtie,samtools,java,

image.png

再根据说明建index,

mkdir -pv DOWNLOAD_DIR
cd DOWNLOAD_DIR

# Download the soft-masked, primary assembly Genome Fasta file
wget ftp://ftp.ensembl.org/pub/release-85/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna_sm.primary_assembly.fa.gz

# Download the corresponding GTF file.
wget ftp://ftp.ensembl.org/pub/release-85/gtf/homo_sapiens/Homo_sapiens.GRCh38.85.gtf.gz

# This command will go through all the steps for creating the index
python indrops.py project.yaml build_index \
    --genome-fasta-gz DOWNLOAD_DIR/Homo_sapiens.GRCh38.dna_sm.primary_assembly.fa.gz \
    --ensembl-gtf-gz DOWNLOAD_DIR/Homo_sapiens.GRCh38.85.gtf.gz

跑这一步需要用到project.yaml。
这里是我配置的文件,

project_name : "test"
project_dir : "/cygene/work/03.indrop_data"

paths : 
  bowtie_index : "/cygene/work/03.indrop_data/DOWNLOAD_DIR"  # 由于bowtie index要建的地址,一定要写到DOWNLEAD_DIR,否则会报错找不到ref。
  bowtie_dir : "/home/dushiyi/software/biosoftware/bowtie-1.2.2-linux-x86_64" # 这是bowtie安装路径,下载,解压就可以了,
  python_dir : "/root/anaconda2/bin" # python 安装路径,
  samtools_dir : "/home/dushiyi/software/biosoftware/samtools-1.3.1/bin/samtools" #samtools 安装路径
  rsem_dir : "/home/dushiyi/software/biosoftware/RSEM-1.3.1/" # rsem 安装路径
  java_dir : "/usr/bin/"  # java安装路径

sequencing_runs : 
  - name : "Test_du"  # 随便起名
    version : 'v1'
    dir : "/cygene/work/03.indrop_data/"  # 这里是data的路径
    fastq_path : "{library_prefix}_{split_affix}_{read}_001.fastq.gz"  read是R1,R2两个,
    split_affixes : ["L007"]
    libraries : 
      - {library_name: "L007", library_prefix: "WBJPE18020236_HMWMYCCXY_L7_WBJPE18020236_20180818_P_S1"}
# 所以fastq名称应该是 WBJPE18020236_HMWMYCCXY_L7_WBJPE18020236_20180818_P_S1_L007_R1_001.fastq.gz
parameters : # OPTIONAL PARAMETERS # 这些都是默认参数。
  umi_quantification_arguments:
    m : 10 #Ignore reads with more than M alignments, after filtering on distance from transcript end.
    u : 1 #Ignore counts from UMI that should be split among more than U genes.
    d : 600 #Maximal distance from transcript end, NOT INCLUDING THE POLYA TAIL
    split-ambigs: False #If umi is assigned to m genes, add 1/m to each gene's count (instead of 1)
    min_non_polyA: 15 #Require reads to align to this much non-polyA sequence. (Set to 0 to disable filtering on this parameter.)
  output_arguments:
    output_unaligned_reads_to_other_fastq: False
    filter_alignments_to_softmasked_regions: False
    # low_complexity_mask: False
  bowtie_arguments:
    m : 200
    n : 1
    l : 15
    e : 80
  trimmomatic_arguments:
    LEADING: "28"
    SLIDINGWINDOW: "4:20"
    MINLEN: "16"
    argument_order: ['LEADING','SLIDINGWINDOW','MINLEN']
  low_complexity_filter_arguments:
    max_low_complexity_fraction: 0.50

相关文章

  • indrop数据分析

    软件:https://github.com/indrops/indrops 第一步先将软件下载下来,采用git c...

  • inDrop scRNA-seq: Droplet-based

    DNA barcoding:是一种利用基因组内的DNA片段来鉴定生物物种的技术。 下文讲的是 inDrop scR...

  • 一图知晓数据分析与数据挖掘的区别是什么?

    数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就...

  • 数据挖掘和分析的区别

    数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就...

  • 一图知晓数据分析与数据挖掘的区别是什么?

    数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就...

  • 数据分析与数据挖掘的区别是什么?

    数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就...

  • 小菜鸟偷学数据分析(一)

    1.1数据分析是神马? 1.1.1何谓数据分析 数据分析就是对数据进行分析,较为专业的说法,数据分析是指用适当...

  • 数据分析方法

    一、数据分析分类:描述性数据分析、探索性数据分析、验证性数据分析。 1、描述性数据分析:1)对比分析;2)平均分析...

  • 谁说菜鸟不会数据分析(入门篇)

    1、数据分析那些事儿 数据分析是神马 数据分析: 数据分析是指用适当的统计分析方法对搜集来的大量数据进行分析,将他...

  • 数据分析概论

    数据分析框架 整个分析框架发为四大层次 数据规划 数据采集 数据分析 数据决策 在数据分析框架中,用户是数据的来源...

网友评论

    本文标题:indrop数据分析

    本文链接:https://www.haomeiwen.com/subject/qcagwftx.html