美文网首页
搜寻序列

搜寻序列

作者: 苏牧传媒 | 来源:发表于2019-01-03 23:31 被阅读32次

1.拿到的原始序列:

2.去除>chrM:

awk 'BEGIN{FS=" "}{print $2}' seq.txt > seq.01.txt

3.在末尾添加NGG:

发现换行符有问题:

cat -A seq.01.txt

^M是windows的换行符,应该去掉:

去掉:

sed -i 's/\r//g' seq.01.txt

cat -A seq.01.txt

添加NGG:

sed 's/$/&NGG/g' seq.01.txt | head

3.使用 seqkit locate 寻找:

F/R链+没有mismatch+全基因组

fasta=/media/shen/6a524d78-97d1-481c-b068-8116a4d007f8/sun/refdata/gencode_GRCm38/raw_fasta/GRCm38.p6.genome.fa

取第一个试下:

seqkit locate -i -p aagcactgaaaatgcttagaNGG $fasta -j 20

all:

for i in `cat seq.fine.txt`

do

echo $i greping.....

seqkit locate -i -p $i $fasta -j 20 -d >> result.txt

done

卧槽太慢了。

换个方法:

sed -i 's/\r//g' seq.txt

sed 's/$/&NGG/g' seq.txt > seq.fa

sed 's/ /\n/g' seq.fa > seq.fine.fa

小程序ref: https://github.com/ekg/fasta-to-fastq

$ chmod u+x fasta_to_fastq.pl

$ perl fasta_to_fastq.pl reads.fasta > my_converted_fasta.fq

# 转为大写:

$ cat seq.fine.fq | tr 'a-z' 'A-Z' > seq.fine.ok.fq

index=/media/shen/6a524d78-97d1-481c-b068-8116a4d007f8/sun/refdata/gencode_GRCm38/01_bowtie2/genome

bowtie2 -x $index -N 0 --end-to-end -a --reorder -U seq.fine.fq -p 10 -S seq.sam

不行...



应该用本地blast:

安装:

相关文章

  • 搜寻序列

    1.拿到的原始序列: 2.去除>chrM: awk 'BEGIN{FS=" "}{print $2}' seq.t...

  • 搜寻

    搜寻 昨天,随手看了《庄子》的片段文字,大意是说:世界呈现给人们一个样子,让眼睛看到了眼色,让耳朵听到了声音……。...

  • 搜寻

    墨记·日歌(壹仟肆佰壹拾·2022.10.14) · 搜寻 文/叶潇(湖北) · 为了搜寻一条可以果腹的鱼 我们在...

  • 搜寻

    就要过年了,秉承我疏亲慢友的传统, 不是,遵循我一贯为众人抱薪的风骨,介绍个应景又温馨的电影给大家~ 这个电影,叫...

  • 最大子序列问题的求解

    问题# 方案一# 思路## 先搜寻出所有的子序列,然后求和比较 代码## 结果## 分析## 此方案用了三层循环,...

  • 搜寻(上)

    再经历过与洛的第二次交锋之后,我似乎又有了一定的线索,洛现在可能并不是只是在做自己魔术师的工作。况且从他对他妹妹的...

  • 搜寻记忆

    昨天遛弯回来的半路上,遇到了张杰和胡秀英。两个人准备洗温泉去,并邀我也去。我自是很高兴,但是迫于家里事情太多,无法...

  • 搜寻(下)

    露的话也不禁提醒了我,我们所在的环境已经变得更加的危险了。正当我们逐渐向前走的时候,在夜视仪之中我们发现了一具具干...

  • 搜寻专家

    张三刚出门没几步,就听见老婆王翠花的叫声:老张,回来,给我找一下手机。 张三听若无闻,反而加快了脚步往前...

  • 搜寻行星

    文 声 我慢慢睁开双眼,努力让自己调整状态,恢复感官知觉。每次醒来都是这种感觉不到什么东西的感觉充斥着我的全身,这...

网友评论

      本文标题:搜寻序列

      本文链接:https://www.haomeiwen.com/subject/oiscrqtx.html