美文网首页画图,可视化
R 数据可视化 —— igraph 创建图

R 数据可视化 —— igraph 创建图

作者: 名本无名 | 来源:发表于2021-05-20 21:44 被阅读0次

    前言

    接下去的部分,我们要开始介绍层次关系与网络关系图片的绘制。

    层次关系型图标主要用于表达个体之间的层次关系,通常可以用来展示分类的多级关系,例如层次聚类的树状图、节点连接图、冰柱图、旭日图、圆填充图、矩形树状图等

    不同于层次关系结构,网络关系结构并不是自底向上或自顶向下的层次结构,展示了不同元素之间的更加自由和复杂的相互关系。如桑葚图、和弦图、弧长链接图、蜂箱图、边绑定图等。

    在图论中,图是由若干个节点或顶点(nodevertex)和连接两个节点的边(edge)构成的图形,用于表示事物之间的关系,而树也是图的一种。

    在生物信息领域,最常见的网络图应该就是基因/蛋白质互作网络图,例如常见的 KEGG 通路图,而 GO 通路则是以树的形式展现各生物学过程之间的包含、并列关系。

    R 中,绘制这些图形的包也比较多,如 igraphggraphcirclize。而我们也主要介绍这三个包。

    在开始绘制这些图形之前,我们先从介绍包的使用开始。首先是 igraph

    igraph

    igraph 是一个集成的高效且易于使用的网络分析工具,可以在 RPythonC/C++Mathematica 中使用。

    安装导入

    install.packages("igraph")
    
    library(igraph)
    

    创建图形

    1. 创建简单图形

    使用 graphmake_graph 函数可以创建一个简单的有向图

    g <- graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))
    # g <- make_graph(edges = c(1, 2, 2, 3, 3, 4, 5, 6))
    

    我们为 edges 参数传递了一个边向量,其中第一、二两个元素构成一条边,第三、四两个元素构成一条边,以此类推。

    如果传递的是数值向量,会将值作为节点的 ID,字符向量的值将作为节点的名称,函数返回一个 igraph 对象

    > class(g)
    [1] "igraph"
    

    直接将返回的 igraph 对象传递给 plot 函数,就可以显示图形

    plot(g)
    

    默认绘制的是有向图,可以设置 directed = FALSE 绘制无向图

    g <- graph(edges = c("A", "B", "B", "C", "C", "D"), directed = FALSE)
    
    plot(g)
    

    也可以使用对应的简便函数来绘制有向图和无向图

    directed_graph(...)
    undirected_graph(...)
    
    # 相当于
    make_directed_graph(edges, n = max(edges))
    make_undirected_graph(edges, n = max(edges))
    

    例如

    g <- undirected_graph(edges = c("A", "B", "B", "C", "C", "D"))
    
    plot(g)
    

    也可以传递字符标量

    graph <- graph( 
      ~ A-B-C-D-A, E-A:B:C:D,
      F-G-H-I-F, J-F:G:H:I,
      K-L-M-N-K, O-K:L:M:N,
      P-Q-R-S-P, T-P:Q:R:S,
      B-F, E-J, C-I, L-T, O-T, M-S,
      C-P, C-L, I-L, I-P)
    plot(graph)
    

    或者传入预定义的一些图形名称

    solids <- list(
      graph("Tetrahedron"),
      graph("Cubical"),
      graph("Octahedron"),
      graph("Dodecahedron"),
      graph("Icosahedron"),
      graph("Bull"),
      graph("Coxeter"),
      graph("Diamond"),
      graph("Levi")
    )
    
    par(mfrow=c(3,3))
    for (i in seq_along(solids)) {
      x = (i - 1) %/% 3 + 1
      y = (i - 1) %% 3 + 1
      plot(solids[[i]])
    }
    

    2. 创建特定图形

    2.1 特定图形

    igraph 还提供了许多 make_* 形式的函数,用于创建不同结构的图

    例如,创建一个环形图

    g <- make_ring(10)
    

    星形图

    make_star(10, mode = "out")
    

    栅格图

    g <- make_lattice(length = 5, dim = 2)
    

    构建一棵二叉树

    g <- make_tree(10, 2)
    

    创建全连接图

    g <- make_full_graph(5)
    

    创建一个没有边的图

    g <- make_empty_graph(10)
    

    2.2 随机图形

    igraph 中提供的 sample_* 函数,用于生成随机图形

    伯努利随机图,n、m 分别代表节点和边的个数

    g <- sample_gnm(n = 20, m = 20)
    

    n、p 分别设置节点个数和每两个节点之间绘制边的概率

    g <- sample_gnp(n = 20, p = 1/10)
    

    3. graph_from_literal

    graph_from_literal 可以方便的创建较小的图,以传递表达式的方式来创建图形。

    表达式由节点名称和边运算符组成,- 表示无向的边, + 表示有向边。边可以是任意长度,即可以添加任意数量的 -,如果只包含 -,则创建无向图。

    例如

    graph_from_literal(A-B)
    
    graph_from_literal( A-----B, C--D, E--F, G--H, I, J, K )
    

    : 操作符用于定义节点集合,如果连接两个集合,则集合中的每个节点都会与另一个集合相连

    graph_from_literal( A:B:C:D -- A:B:C:D )
    

    添加箭头

    graph_from_literal( A +-+ B +---+ C ++ D + E)
    

    在有向图中,只有包含 + 的边才会绘制,例如

    graph_from_literal( A +- B -- C )
    

    如果节点的名称包含空格或其他特殊字符,需要添加引号

    graph_from_literal( "my" +- "salary is " -+ "$100" )
    

    4. 从数据中创建

    4.1 使用数据框创建

    可以使用 graph_from_data_frame(或 from_data_frame) 函数从一个或多个包含节点或边的数据框中创建 igraph 对象。

    graph_from_data_frame(d, directed = TRUE, vertices = NULL)
    
    from_data_frame(...)
    

    根据 vertices 参数是否为 null,会有两种不同的操作模式。

    如果 vertices = NULL,则数据框的前两列表示边列表,剩下的列表示边的属性。

    如果 vertices 不为空,则必须是一个包含节点信息的数据框。第一列将作为节点的名称,显示在图中,其他列作为节点的属性,且只保留边列表 d 中包含这些节点的边

    示例

    # 定义节点
    actors <- data.frame(
      name = c("Alice", "Bob", "Cecil", "David",
               "Esmeralda"),
      age = c(48, 33, 45, 34, 21),
      gender = c("F", "M", "F", "M", "F")
    )
    # 定义边
    relations <- data.frame(
      from = c("Bob", "Cecil", "Cecil", "David",
               "David", "Esmeralda"),
      to = c("Alice", "Bob", "Alice", "Alice", "Bob", "Alice"),
      same.dept = c(FALSE, FALSE, TRUE, FALSE, FALSE, TRUE),
      friendship = c(4, 5, 5, 2, 1, 1),
      advice = c(4, 5, 5, 4, 2, 3)
    )
    # 将数据转换为 igraph 对象
    g <- graph_from_data_frame(
      relations, directed = TRUE, 
      vertices = actors
    )
    plot(g)
    

    as_data_frame 用于将 igraph 对象转换为一个或多个数据框。根据 what 参数来进行转换,可选的值为 c("edges", "vertices", "both")

    > as_data_frame(g, what = "edges")
           from    to same.dept friendship advice
    1       Bob Alice     FALSE          4      4
    2     Cecil   Bob     FALSE          5      5
    3     Cecil Alice      TRUE          5      5
    4     David Alice     FALSE          2      4
    5     David   Bob     FALSE          1      2
    6 Esmeralda Alice      TRUE          1      3
    > as_data_frame(g, what = "vertices")
                   name age gender
    Alice         Alice  48      F
    Bob             Bob  33      M
    Cecil         Cecil  45      F
    David         David  34      M
    Esmeralda Esmeralda  21      F
    

    如果为 both,则会将节点和边以数据框列表的形式返回

    4.2 使用边列表

    graph_from_edgelist 用于从边列表来创建 igraph 对象,接受一个包含两列的矩阵,每行定义了一条边。

    el <- matrix( c("foo", "bar", "bar", "foobar"), nc = 2, byrow = TRUE)
    g <- graph_from_edgelist(el)
    

    创建一个环形图

    g <- graph_from_edgelist(cbind(1:10, c(2:10, 1)))
    

    4.3 邻接矩阵

    graph_from_adjacency_matrix 是一个灵活的函数,能够使用邻接矩阵来创建 igraph 对象

    graph_from_adjacency_matrix(adjmatrix, mode = c("directed", "undirected",
      "max", "min", "upper", "lower", "plus"), weighted = NULL,
      diag = TRUE, add.colnames = NULL, add.rownames = NA)
    

    节点的顺序将依照矩阵的顺序排序,mode 参数各个值的含义为:

    • directed:有向图
    • undirected:无向图,与 max 一样
    • max:将 max(A(i,j), A(j,i)) 作为无向图边的值
    • upper:使用上三角来构建无向图
    • lower:使用下三角来构建无向图
    • min:将 min(A(i,j), A(j,i)) 作为无向图边的值
    • plus:将 A(i,j)+A(j,i) 作为无向图边的值

    如果 weighted 参数为 TRUE,会创建加权图

    示例

    adjm <- matrix(sample(0:1, 100, replace = TRUE, prob = c(0.9, 0.1)), nc = 10)
    g1 <- graph_from_adjacency_matrix(adjm)
    plot(g1)
    
    g2 <- graph_from_adjacency_matrix(adjm, weighted=TRUE)
    

    获取 igraph 对象节点的权重

    > E(g2)$weight
    [1] 1 1 1 1 1 1 1 1 1
    

    设置行列名称

    colnames(adjm) <- sample(letters, ncol(adjm))
    rownames(adjm) <- seq(nrow(adjm))
    
    g3 <- graph_from_adjacency_matrix(adjm, weighted=TRUE, add.rownames="code")
    plot(g3)
    

    4.4 图层

    我们还可以使用类似 ggplot2 图层的方式,使用 + 来添加节点和边,例如

    g <- make_empty_graph(directed = FALSE) + 
      vertices(LETTERS[1:10]) +
      edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J')
    plot(g)
    

    我们首先使用 make_empty_graph 创建一个空的图,默认为有向图,设置 directed = FALSE 来绘制无向图

    然后,使用 + 来添加 vertices() 创建的结点和 edges() 创建的边

    还可以使用 - 来删除某些节点或者边,例如

    g <- make_empty_graph(directed = FALSE) + 
      vertices(LETTERS[1:10]) +
      edges('A','B', 'B','D', 'C','D', 'D','E', 'E','G', 'F','G', 'G','H', 'H','I', 'I','J') -
      vertices(LETTERS[5]) -
      edges('A|B', 'I|J')
    plot(g)
    

    删除边的使用,传递给 edges() 的值略有不同,要删除的边为使用 | 连接两个节点名称的字符串形式

    相关文章

      网友评论

        本文标题:R 数据可视化 —— igraph 创建图

        本文链接:https://www.haomeiwen.com/subject/arovjltx.html