转自:https://mp.weixin.qq.com/s/8MTZGcb-ywuo1d_DALExtA
eGPS 下载地址:http://www.egps-software.net
这里介绍eGPS 更新后的韦恩图模块,交互式操作更加便捷,各种参数下的结果“所见即所得”。这里介绍的三种形式是最常用,最直观,最易于被人接受的三种形式。这三种形式各有优缺点。为了更好地促进用户交互式使用,我们增加了探索性分析。以上图形的展示是被动的,需要观察者被动接受信息。我们的韦恩图模块支持观察者主动去获取某个集合。例如有三个输出集合,我们就想查看集合1与集合2的交集,而不考虑集合3,这就需要有交互式的软件来完成这个工作。正好,现在eGPS就有此功能,详情请查看探索性分析的功能。
韦恩图:
一 韦恩图的原理
有若干集合,用一图显示其交、差、并等关系的图,即为韦恩图。通俗地讲:交集就是两个集合共有的元素所组成的集合;差集就是一个集合中有而另一个集合不存在的元素的集合;并集就是两者之一所含有的元素的集合。以上就是全部原理。
一般有两种类型的韦恩图,传统的用各个圆圈的排布组合所形成的图形。还有就是Upset图,前几年兴起的一种图形。当显示的集合数量过多时,前者已经不再适用。但是传统的韦恩图也有其好处,2-3个集合的时候可以根据大小显示,而且其包含、交叉关系更加直观。
二 输入格式
本模块的输入格式为以tab键分隔的文本文件,根据集合元素的不同可以分为两种具体的类型。第一种是String类型,下面是一个示例内容:
图片第一列固定为集合名称,后面几列为具体的元素。第二种是Genomic region类型,下面是一个示例内容:
图片该类型与String的区别在于所有元素是以逗号分隔的基因组区域。
二、快速上手:
如果不想看文字版的描述请移步,下面的视频适用于eGPS v1.8及更早版本。Bilibili https://space.bilibili.com/479371629/channel/detail?cid=95839
打开软件,依次点击菜单栏的 iTools --> Venn diagram 进入模块。
- 输入数据
有两种方式可以输入数据:第一种是从文件中导入,点击Import file 按钮即可弹出对话框。鼠标悬停在按钮上时可以看到输入文件应该具有的格式。注意在导入数据之前,你需要根据需要选择你的内容是Single string 还是Genomic regions。
第二种是很方便快捷型的方式,直接在内容面板的输入框中粘贴字符串即可。如果想看示例数据,请直接点击Display example按钮。进入模块后,我们已经准备了测试数据,数据位于Import content区域。
输入数据之后,点击下面的View venn diagram进入可视化界面。
- 参数设置
首先显示的是传统的韦恩图Classical venn plot。
图片点击 按钮或者点击左侧的Upset plot按钮进入Upset plot可视化界面。左侧控制面板的所有按钮都是交互式的,可以直接点击看效果,这里不在赘述。
图片Exporary Analysis 一栏的功能,请看下文的介绍。
对于初次使用者,还有一个Plain text info. 的tab,这里直接以字符串的形式显示了多个集合交集的情况。在顶部我们还提供了Jarcard index,这用来表征输入集合的相似性,其实它也是一种重要的距离度量指标。
图片- 出图保存
点击工具栏上的保存按钮即可保存。我们支持png, svg, pdf等格式。
三、eGPS的优势
那我们有什么优势呢?简单、方便、交互式!学习成本低!
如果不想看文字版的描述请移步,下面的视频适用于eGPS v1.8及更早版本。Bilibili
1. 灵活便捷的数据输入与三种形式的信息展示快速切换
传统韦恩图,Upset plot 和文本格式的展示方式可以很方便地展示集合之间的情况。正如标题所述,数据输入与出图相辅相成。“所见即所得”。
2. 不仅支持简单的字符串,还支持基因组区间
用户可以在输入面板中,Content处选择Genomic region,然后再点击Display example,查看该个功能的效果。
该功能的原理:功能上仅仅是将simple string的字符串中的相等规则的判定更改。原先是比较两个字符串是否内容一致,现在成了两个要比较的区间是否是重叠的。
3. 图形是高度交互的,而不是静态的图片
便捷操作
图片第一个选择框:是否展示左上角的饼图
饼图的绘制原理:最内部的灰色的圆代表的是所有集合的并集。外面的每一圈都代表各个集合在并集上的分布。从外向内的圆环分别对应从下到上的left bar。
第二个选择框:是否展示图例 第三个选择框:是否显示上面柱子的具体的数值。
第一个按钮:自适应屏幕,当改变软件窗口大小的时候,点此按钮重新出图。第二个按钮:随机化所有柱子颜色。第三个按钮:删除上面为数值为0的所有柱子。第四个按钮:查找元素所在的集合,若在该个集合,则会以选中的形式出现。
Display Options
图片这些操作顾名思义。
我们还支持在图形区域的交互式操作:
左键单击可以设置若干元素的选中状态,支持Ctrl键连选。选中后可点击工具栏上的change color选项改变颜色。下图是改变颜色的操作界面。
图片右键单击圆圈或者竖直的柱子可以用五角星标记目标交集。
双击竖直的柱子或者圆圈所在的位置可以显示具体的元素内容。
双击title与name可以改内容。
传统韦恩图可以通过点击图例选中目标集合。
传统韦恩图的交互
图片支持交互式拖拽图形,适合微调一些视觉元素。在Upset plot中可以拖拽各个区域的边界,调整每个区域的大小。
4. 支持探索性分析
探索性分析,主要针对的是如下的需求:假设导入了N个集合,用户想看第1个与第2个集合的交集,或者用户想看第1个集合中去除第二个集合元素之后的情况……等等一系列的需求。
在Exporary Analysis一栏中点击Enable analysis选择框。启用探索性分析。第一步选择特定集合的使用情况,这总共有三种情况:与这个集合的元素取交集、去除这个集合的元素和不考虑这个集合。
第二步:点击Add item增加这个结果,点击remove last item去除最后一个结果,点击clear去除所有结果。
现在我们可以实现开头所说的一个需求,用户只要include 集合1和集合2,然后把集合3设定为Not take into consideration即可。
5. 传统的韦恩图根据大小显示经过优化
传统韦恩图在2-3个集合的可视化时,我们支持显示内容与集合大小一致。
传统韦恩图2-3个集合可视化
图片值得一提的是,我们三个集合的这种展示经过一定优化,可以处理比较多的包含与交叉的关系。
最后我们再来看一下这三种形式韦恩图的优缺点:
图片最后再贴一下我们的联系地址:
eGPS 下载地址:http://www.egps-software.net
网友评论