写在前面 - BioPanGu
这段时间,我一直在“整合分析”一些数据。每次开始分析,我就开始“骂”,为什么就没有一个顺手的工具。为什么这个项目有几个表达量表格?为什么我拿到 ID 却又要去找注释信息文件,提取注释信息?为什么我看个表达量,一会看这个Excel表格,一会看那个Excel表格;为什么我就是想要几个基因的序列,我要找到序列文件来分析?
我实在是,受不了了,“十十”!我一直在忍,一直在忍。现在,我受够了。
对于数据分析,我们需要的是“不间断的思绪”,不应该总是让“突然要找某个文件”这种事情来扰乱分析思路。
于是,昨晚(2021年12月25日),年轻人们在朋友圈晒周末活动的同时,我花了整整一个晚上,写了一个 TBtools 插件,取名:BioPanGu。大体界面如下:
关闭重启TBtools,项目数据保存,永远能快速找到你的数据,并马上开始分析。
项目管理 - 左侧
类似 BlastZone,可以按照自己需要,制定不同的目录树。如上图,我按照物种做了归类放置。选中“荔枝”,点击了“Use Curr. Proj.”,即加载该项目。加载后,注意到左侧有箭头,可以点击隐藏这一面板。
数据加载与使用 - 中间
项目加载后,可以看到中间上部显示“Curr.Proj:荔枝”,即当前分析项目。目前,每个项目分为三种类型数据:
1. Sequence
即序列数据,可通过点击 Add Seqs ,给上Fasta格式的序列,即可完成装载。可以看到,图中已经加载了:基因组v3,第一版基因组,蛋白序列v3,名字可以自行指定。
2. Expression
即表达数据,可通过点击 Add Exp, 给上基因表达矩阵,或者事实上,其他任何矩阵也可以。注意需要有表头,同时第一列应该是基因ID。
3. Annotation
即注释数据,可通过点击 Add Anno,加上注释信息表格即可。注意最好有表头,同时第一列应该是基因ID。
数据分析 - 右侧
之间点击“中间面板”任意摁钮,即可自动加载对应数据在右侧面板。
如果是序列信息,那么会自动弹出并自动装载好序列数据,只要黏贴 ID 或者区间即可提取序列;如果是表达信息或者是注释信息,同样,都是自动弹出自动装载,只要黏贴 ID 即可整理提取。
当然,如果要删除某个数据,键盘摁住 Ctrl ,点击对应按钮即可删除。
PS: 右侧这块是接下来优化的重点,不过目前应该足够使用了。我个人有更多的计划,但是不是现在做。
写在最后
不瞒大伙,我对这个插件的想法,远不止现在的状态。但时间有限,暂时先写一个能用的,解决我当前数据分析的燃眉之急再说。同样,我在一两年前就有类似工具的想法,只是我一直想动手,但想想又不动了,等又一次分析数据,又想动手,想想又算了...我们不应该犹豫做与不做,做的好与不好,只要不是伤天害理,不忠不义,那就做了再说。
当然,最后问题来了,这个插件情况相比于其他功能都会特殊:
- 实用但是也不实用,可能只有部分人能明白他到底多有用;
- 使用但几乎不会得到引用,因为这个功能最大用于是项目管理和整合分析(目前实现前者;后者尚待开发)
于是,先看看大伙的想法再说,投个票吧,看看大伙的想法,尽管很大可能我还是会坚持自己的想法。
网友评论