美文网首页
转录组分析Day2笔记--xiaofan1991

转录组分析Day2笔记--xiaofan1991

作者: xiaofan1991 | 来源:发表于2019-06-05 09:49 被阅读0次

    一、 linux基础知识复习
    1. 输入pwd
    /home/u2754
    
    1. 输入ls和ls的加强版ls -lrt --color=auto
    total 0
    
    1. cd是切换目录,cd -是切换到刚才的目录,cd ..是切换到上一级目录
    2. mkdir是创建目录,输入mkdir $(date +%F),生成以当前时期命名的目录
    2019-06-04
    
    1. rmdir删除空目录,如果有多个空目录,使用find. -type d -empty -print |xargs rmdir
    2. rm删除文件或目录,rm -r 表示递归删除
    3. touch新建一个文件
    touch mytest.txt
    
    1. mv重命名文件或者目录;移动A文件到B目录下
    mv mytest.txt mytest1991.txt
    mv mytest.txt fanfan
    

    9.cat重定向输出文本,就是替换文本中原来的内容

    cat mytest.txt
    空的
    cat >mytest.txt
    复制粘贴、或输入替换进去的内容
    Enter切换到下一行,Ctrl+C
    I love bioinformatics!
    Dou and Hua
    若预先不存在mytest.txt这个文件,会自动创建
    
    1. less -SN表示的形式加上制表符和行号
    2. head -n表示查看文件头n行;tail -n表示查看文件尾n行
    3. wc -l计算文件有多少行
    4. |管道操作,前面的输出作为后面的输入,cat test.txt | wc -l
    5. xargs将之前的管道操作逐项操作
    6. 同时创建多层目录,只需要加上参数-p
    mkdir -p tmp/1/2/3/4/5
    tree
    
    image.png
    1. 向目录5下创建xi.txt,并向其中输入Hello world, Welcome to bioinfoplanet, Nice to see you。
    cd tmp/1/2/3/4/5
    cat >xi.txt
    
    image.png
    1. 在tmp/下创建 1~5这5个文件夹,然后每个文件夹下面继续创建 1~5这5个文件夹
    mkdir -p {1,2,3,4,5}/{1,2,3,4,5}
    
    image.png
    1. 想在17的每个目录中都放进去一个文件xi.txt
    没弄出来
    
    1. 下载http://www.biotrainee.com/jmzeng/igv/test.bed
    wget -c http://www.biotrainee.com/jmzeng/igv/test.bed
    wc -l test.bed
    10 test.bed
    grep -rn "H3K4me3" test.bed
    8:chr1  9810    10438   ID=SRX387603;Name=H3K4me3%20(@%20HMLE);Title=GSM1280527:%20HMLE%20Twist3D%20H3K4me3%20rep2%3B%20Homo%20sapiens%3B%20ChIP-Seq;Cell%20group=Breast;<br>source_name=HMLE_Twist3D_H3K4me3;cell%20type=human%20mammary%20epithelial%20cells;transfected%20with=Twist1;culture%20type=sphere;chip%20antibody=H3K4me3;chip%20antibody%20vendor=Millipore;  222 .   9810    10438   0,226,255
    显示比较混乱
    less -SN test.bed
          1 track name="His (@ Brs) 50" url="http://chip-atlas.org/view?id=$$" gffTags="on"
          2 chr1    9769    10673   ID=SRX539644;Name=H3K27ac%20(@%20HMEC);Title=GSM1383853:%20HMEC%20H3K27ac%20ChIP-Seq%3B%20
          3 chr1    9776    10481   ID=SRX387611;Name=H3K27me3%20(@%20HMLE);Title=GSM1280524:%20HMLE%20Twist3D%20H3K27me3%20re
          4 chr1    9788    10497   ID=SRX539646;Name=H3K4me1%20(@%20HMEC);Title=GSM1383855:%20HMEC%20H3K4me1%20ChIP-Seq%3B%20
          5 chr1    9795    10434   ID=SRX387610;Name=H3%20(@%20HMLE);Title=GSM1280523:%20HMLE%20Twist2D%20H3%3B%20Homo%20sapi
          6 chr1    9799    10446   ID=SRX1795468;Name=H3K27ac%20(@%20MCF-7);Title=GSM2175788:%20H3K27Ac%20ChIP-seq%20MCF7%2BE
          7 chr1    9805    10419   ID=SRX1795465;Name=H3K27ac%20(@%20MCF-7);Title=GSM2175785:%20H3K27Ac%20ChIP-seq%20MCF7%2BE
          8 chr1    9810    10438   ID=SRX387603;Name=H3K4me3%20(@%20HMLE);Title=GSM1280527:%20HMLE%20Twist3D%20H3K4me3%20rep2
          9 chr1    9811    10465   ID=SRX539650;Name=H3K27ac%20(@%20MCF-7);Title=GSM1383859:%20MCF7%20H3K27ac%20ChIP-Seq%3B%2
         10 chr1    9825    10306   ID=SRX1115312;Name=H3K27ac%20(@%20MCF%2010A);Title=GSM1829629:%20H3K27Ac%20ChIPSeq%3B%20Ho
    test.bed (END)
    按q退出
    
    1. 下载
    wget -c http://www.biotrainee.com/jmzeng/rmDuplicate.zip
    unzip rmDuplicate.zip
    cd rmDuplicate
    tree
    
    image.png
    二、vim编辑器的使用
    1. 使用vi file对文件进行操作
    vi mytest.txt
    默认进入命令模式 command mode
    输入i进入insert mode
    在左下角会多一个-- INSERT --
    按ESC再退回命令模式
    1.命令模式退出要注意
    :x或者:wq 都是保存并退出
    :q! 不保存强制退出
    :w new_file 另存为新文件
    在命令模式下注意,按u撤销
    2.按ESC确保进入命令模式的前提下,输入:w进入末行模式,即在左下角最后一行出现文件名
    
    image.png
    image.png
    三、linux文本处理三剑客
    先下载数据 wget http://molb7621.github.io/workshop/_downloads/SP1.fq
    统计行数 wc -l SP1.fq  
    统计fq序列数 wc -l SP1.fq | awk '{print $1/4}'
    1.得到行号 awk '{print NR}' SP1.fq
    2.利用BEGIN处理4行
    awk 'BEGIN {print 1%4}'
    awk 'BEGIN {print 2%4}'
    awk 'BEGIN {print 3%4}'
    awk 'BEGIN {print 4%4}'
    3.根据条件判断取出相应的行
    awk 'NR % 4 == 1' SP1.fq
    4.利用管道符方便操作
    awk 'NR % 4 ==2' SP1.fq | sort | uniq -c  | wc -l
    

    感觉还有很多没弄明白,明天答辩完再弄吧

    相关文章

      网友评论

          本文标题:转录组分析Day2笔记--xiaofan1991

          本文链接:https://www.haomeiwen.com/subject/suekxctx.html