circlize(一):引言

作者: 菜刀_ebc3 | 来源:发表于2022-06-15 20:06 被阅读0次

    圆形布局对于展示复杂多个分类、多维数据以及不同元素间的联系。Circos是一个常用的展示圆形布局图形的软件,它由perl语言编写,在使用时需要编辑配置文件用来设置图形的各项参数。circlize包的目的是使用R语言实现circos的功能。R语言可以实现数据分析和可视化,因此在R中可以方便的以交互的方式实现circos图绘制。

    1.1 设计原则

    首先应明确几个概念。一个circos图由扇区sectors)和轨道tracks)组成。不同分类的数据在分布在不同的扇区上,同一个分类的多个维度的数据在不同的轨道上堆叠。一个扇区和一个轨道的交点就是一个单元格cellgrid或者panel),是circos图中基本的绘图单位。
    大多数图形都是由点、线、多边形等简单的元素组合而成。circlize可以在circos图中添加这样的低级图形,并且通过它们之间的不同组合实现各种复杂的图形。这一点可以使circlize具有更高的灵活性。
    circlize包中有以下几个低级绘图函数:

    • circos.points():绘制点图;
    • circos.lines():绘制折线图;
    • circos.segments():绘制线段;
    • circos.rect():绘制矩形;
    • circos.polygon():绘制多边形;
    • circos.text():添加文本;
    • circos.axis()circos.yaxis():绘制坐标轴;

    以下函数绘制circos图中两个位置之间的链接:

    • circos.link()

    以下函数绘制高级图形:

    • circos.barplot():绘制条形图;
    • circos.boxplot():绘制箱线图;
    • circos.violin():绘制小提琴图;
    • circos.heatmap():绘制圆形热土;
    • circos.raster():绘制栅格图;
    • circos.arrow():绘制圆形箭头;

    以下函数排列circos图的圆形布局:

    • circos.initialize():分配扇区;
    • circos.track():在一个轨道上为不同单元格创建绘图区域;
    • circos.update():更新已经存在的单元格;
    • circos.par():设置或查看绘图参数,起始角度,轨道高度等;
    • circos.info():查看当前circos图的基本参数,扇区数据、轨道数目、当前绘图区域等;
    • circos.clear():重置图形参数和内部变量;
    Figure 1.1: Examples by circlize

    1.2 简单的演示

    我们通过一个简单的示例来了解circlize的基本使用方式。
    首先生成一个随机数据集,包含一个字符向量sectors表示分类,还有两个数值向量xy

    set.seed(999)
    n = 1000
    df = data.frame(sectors = sample(letters[1:8], n, replace = TRUE),
                    x = rnorm(n), y = runif(n))
    

    然后初始化圆形布局。按照不同分类的x轴变量(即以下代码的df$x)的范围对不同扇区的比例进行分配。扇区从θ=0的位置(3点钟方向)开始沿顺时针方向排列。虽然进行初始化,但是并没有绘制轨道,因此并没有图形生成。

    library(circlize)
    circos.par("track.height" = 0.1)
    circos.initialize(df$sectors, x = df$x)
    

    在最开始通过track.height参数设置轨道高度为0.1,代表圆形半径的10%。在初始化之后就可以使用circos.trackPlotRegion()circos.track()函数创建轨道,随后就可以使用低级图形函数在轨道上绘制图形。每一个轨道需要一个统一的y轴范围,可以根据y参数自动计算或者使用给ylim参数提供一个二元数值向量确定y轴范围。

    circos.track(df$sectors, y = df$y,
                 panel.fun = function(x, y) {
                   circos.text(CELL_META$xcenter, 
                               CELL_META$cell.ylim[2] + mm_y(5), 
                               CELL_META$sector.index)
                   circos.axis(labels.cex = 0.6)
                 })
    col = rep(c("#FF0000", "#00FF00"), 4)
    circos.trackPoints(df$sectors, df$x, df$y, col = col, pch = 16, cex = 0.5)
    circos.text(-1, 0.5, "text", sector.index = "a", track.index = 1)
    
    Figure 1.2: First example of circlize, add the first track.

    在上面的一段代码中,circos.track()用于创建新的轨道,逐个生成单元格。circos.track()内部有一个panel.fun()函数用于在生成的单元格同时在单元格内绘制自定义图形,使用circos.axis()生成坐标轴和使用circos.text()添加扇区名称。CELL_META指“元信息,meta information”。
    在创建好第一个轨道后,使用circos.trackPoints()函数在其中绘制点图。还有另一种形式向当前轨道添加点图,就是在panel.fun()函数内使用circos.points()函数。
    低级绘图函数也可以在panel.fun()外使用。上面代码最后一句使用circos.text()在指定的单元格内添加文本“text”。使用sector.indextrack.index参数指定需要添加图形单元格。
    在第二个轨道里绘制直方图。circos.trackHist()是一个高级绘图函数,因此可以创建新的轨道并绘图。

    bgcol = rep(c("#EFEFEF", "#CCCCCC"), 4)
    circos.trackHist(df$sectors, df$x, bin.size = 0.2, bg.col = bgcol, col = NA)
    
    Figure 1.3: First example of circlize, add the second track.
    在第三个轨道里绘制折线图。按照每个单元格随机抽取10个点排序并连线。在circos.track()设置sectorsxy三个参数,其中df$xdf$y按照df$sectors分类并传递给panel.fun()xy参数。
    circos.track(df$sectors, x = df$x, y = df$y,
                 panel.fun = function(x, y) {
                   ind = sample(length(x), 10)
                   x2 = x[ind]
                   y2 = y[ind]
                   od = order(x2)
                   circos.lines(x2[od], y2[od])
                 })
    
    Figure 1.4: First example of circlize, add the third track.
    前面已经绘制好的图形可以通过circos.updatePlotRegion()circos.update()更新。这个函数需要sector.indextrack.index参数明确指定需要更新的单元格,但并能更改xlimylim等设定。随后可以使用低级绘图函数重新在指定单元格添加图形元素。
    circos.update(sector.index = "d", track.index = 2, 
                  bg.col = "#FF8080", bg.border = "black")
    circos.points(x = -2:2, y = rep(0.5, 5), col = "white")
    circos.text(CELL_META$xcenter, CELL_META$ycenter, "updated", col = "white")
    
    Figure 1.5: First example of circlize, update the second track.
    尽管在上一段代码重新指向第二个轨道,但如果要添加新的轨道,它依然会出现在最内层。接下来使用circos.rect()函数绘制热图。
    circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
      xlim = CELL_META$xlim
      ylim = CELL_META$ylim
      breaks = seq(xlim[1], xlim[2], by = 0.1)
      n_breaks = length(breaks)
      circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
                  breaks[-1], rep(ylim[2], n_breaks - 1),
                  col = rand_color(n_breaks), border = NA)
    })
    
    Figure 1.6: First example of circlize, add the fourth track.
    在circos图的中间,使用circos.link()绘制连线或条带链接不同点和区间。
    circos.link("a", 0, "b", 0, h = 0.4)
    circos.link("c", c(-0.5, 0.5), "d", c(-0.5,0.5), col = "red",
                border = "blue", h = 0.2)
    circos.link("e", 0, "g", c(-1,1), col = "green", border = "black", lwd = 2, lty = 2)
    
    Figure 1.7: First example of circlize, add links.

    最后需要重置绘图参数和内部变量,以免影响绘制下一个图形。

    circos.clear()
    

    参考资料

    Chapter 1 Introduction | Circular Visualization in R (jokergoo.github.io)

    相关文章

      网友评论

        本文标题:circlize(一):引言

        本文链接:https://www.haomeiwen.com/subject/fghxvrtx.html