美文网首页数据可视化之美群体基因组学习组装
生信log22|CGviewer升级啦-交互式操作画基因组Cir

生信log22|CGviewer升级啦-交互式操作画基因组Cir

作者: 小周的万用胶囊 | 来源:发表于2021-12-15 16:12 被阅读0次

    用Circos华丽地展现基因组信息,能给论文的锦上添花。很多做基因组分析的文章必有一个点就是展示基因组的圈图,目前的去比较好实现这种可视化的一般依靠perl语言(最原始的版本),R语言和

    0、为什么要做圈图

    • 唬人,华丽(不是);
    • 更好的展现基因组结构及想要突出的信息;
    • 更好地展现基因组之间的差异和隐藏的信息;

    1、圈图展示的信息

    • 展现基因组的结构(正负链)
    • 正负链上各自的编码序列,mRNA序列,tRNA序列
    • 想突出的基因名称及所在位置
    • 比较两个基因组

    2、Circos展示基因组的基础例子

    例子图一 基因组结构事例图二

    3、准备文件

    • 基因组文件Fasta,gbk,gff文件(Prokka注释出来的)

    • 最好使用Genbank的文件,里面记录了基因的名称起始位点等等
      Feature 文件(其实是网站特殊版本的gff文件,此处推荐subline文本编辑器共 5 列,列的顺序没有考究网站可以自动匹配对应名称的列,但是要严格按照网站对列进行命名,可大小写模糊,网站只识别下面的列名)

    • Start: 基因起始位置

    • Stop: 基因结束位置

    • Type:编码序列的种类(CDS/mRNA/gene)

    • Strand:记录正链还是负链的信息

    • Name:基因的名字

    序列的位置信息,序列种类,名字均可以在gbk中找到

    网站要求的feature文件
    我们还可以在网站上手动添加feature
    在网站上添加feature

    操作界面

    • 1、这是一个上传了fasta之后的基本操作界面,显示了基因组的骨架,和大小。


      基本操作界面
    • 2、添加track


      track的添加
    track的编辑
    • 3、添加标题


      标题的设置和位置的调整
    • 4、调整骨架
      隐藏骨架


      骨架调整前
    隐藏骨架后

    是不是清爽多了呢

    • 5、隐藏Label


      Label隐藏前

    Labels的隐藏
    4、 网站可以做的程序
    • 在网站上直接prokka注释,可以得到gff的文件(不会Prokka注释的小伙伴不担心);

    • 在网站上跟的序列做blast(还可以进行一定的筛选),两两之间的比较基因组学;

    • 计算GC%含量 (GC% content);

    • 计算GC偏移(GC% skew);

    评价

    • 总体来说,足够傻瓜,新手友好;
    • 能在网站上手动添加feature的信息;
    • 美中不足 👉🏻还是不能像Circos这个可视化软件一样把多条基因序列堆叠起来,一次仅能展示一条基因组的信息;
    • 不支持和弦图;
    • feature文件的设定过于严谨;
    • 个性化的设置依然受到限制;
    • 开放阅读框显示的legend不分正负链(若是上传fasta文件就会有正负链各有三条信息)
    • 基因组的展示效果欠佳;
    • 网站经常要排队;

    网站地址:

    网站非常简洁易学好懂,入门门槛在文本数据的提取,将放在另外一篇日志记录

    • PS:未来会出一篇传统的Circos从基础文件准备

    参考

    CGview的新地址
    推荐一个新版CGview的视频教程
    CGview的论文

    相关文章

      网友评论

        本文标题:生信log22|CGviewer升级啦-交互式操作画基因组Cir

        本文链接:https://www.haomeiwen.com/subject/lmuatrtx.html