Linux操作复习
data:显示日期
cal:显示相关数据
bc:计算器 scale=5 保留小数点后五位
ctrl+c:终止进程
ctrl+d:终止键盘输入
exit
man
sync
shutdowm:关机重启 shutdown -h +10/shutdown -r +30
reboot
poweroff -f
init:0 关机 3 纯文本模式 5 图形接口 6 重启
chgrp:改变文件群组
chown:改变所有者
chmod:改变权限 chmod a+w #添加书写权限
uname:查看核心版本uname -r
cd
pwd
mkdir
rmdir:删除空目录
ls:-a/-l/-d
cp
rm:删除以aaa开头的文件 rm ./-aaa- #加入./抵消冲突
mv
rename
basename
dirname
cat
tac
nl:nb -b a -n rz -w 4:显示行号且空行编号,行号在右侧显示且行号前加零,且保留四位整数。
more
less
head:-n
tail:-n
od:-t a/c/o/d/x/f
touch
chattr:配置文件隐藏属性
lsattr:显示文档的隐藏属性
file:显示文档类型
which -a command:
whereis:
locate:模糊寻找 locate 123 #找到含123的文件
find
gzip
zcat
bzip2
bzcat
tar
illumina测序原理
主流测序方法:illumina/pacbio/nanopore
前两者均是边合成边测序
illumina测序过程:边合成边测序
桥式PCR增加模板数,增大荧光量。末端终止法控制,合成的速度一致性。illumina150 bp由于桥式PCR限制导致测序片段较短。pacbio几千kb。
选择合适长度片段进行测序,鸟枪法打断后进行加接头adapter(barcode不同),与flow cell上接头序列是反向互补,结合后进行桥式PCR。PCR之后存在两个相反方向的片段,去掉任一方向的片段在进行测序。每一个cycle拍照记录。测出序列后与参考序列进行比对,测序深度足够那么将覆盖所有DNA片段。
一个flowcell上有8个lane
测序后fq文件内容:
每四行为一组
第一行:标识行
第二行:序列信息
第三行:描述信息/注释信息
第四行:质量信息
Q30:Q=-10log10e sanger= Q+33
Q30>80%,至少有80%的错误率小于千分之一
0523报告单倍型多样性和单核苷酸多样性
单倍型多样性和单核苷酸多样性
单倍型多样性:
单核苷酸多样性:
N 代表没有测定的碱基。比如在测序过程中出现gap,那么这一段都用N来代替这些还没有测序、尚不明确的碱基。
网友评论