美文网首页R
R基础 | R代码风格规范

R基础 | R代码风格规范

作者: 琼脂糖 | 来源:发表于2019-07-23 16:11 被阅读0次

    摘录:Hadley Wickham在《advanced R》书中,基于Google's R style guide做了总结和示例。以下为全文(英文原地址)的摘录翻译。

    好的R代码很重要,因为代码往往会被其他人阅读。formatR包(作者Yihui Xie)可以让丑的代码变得好很多。可以尝试用用。

    注释和命名

    文件名

    文件名要有意义,代码文件并以.R结束。数据文件以.RData结束。

    # Good
    fit-models.R
    utility-functions.R
    
    # Bad
    foo.r
    stuff.r
    

    如果需要按顺序运行代码文件,加上数字前缀。

    0-download.R
    1-parse.R
    2-explore.R
    

    对象命名

    变量名,小写,可用_隔开单词。
    函数名,首字母小写,第二及后面词首字母大写。
    一般,变量名字应是名字,而函数名应是动词。

    # Good variables
    day_one
    day_1
    
    #Good function
    displayPlotAgain()
    
    # Bad
    first_day_of_the_month
    DayOne
    dayone
    djm1
    

    最好不要用已存在的变量和函数名。

    # Bad
    T <- FALSE
    c <- 10
    mean <- function(x) sum(x)
    

    函数的参数命名,以.间隔单词。这样函数参数与变量名可以区别开。

    # Preferred
    buildCyc(num.frames=10)
    buildCyc(num.frames=num_frames)
    # Discouraged
    buildCyc(num_frames=10)
    buildCyc(numframes=10)
    buildCyc(numFrames=10)
    

    语法

    空格

    • 中缀运算符(比如=,+,-,<-等)前后要空格。
    • 函数调用中的=前后要有空格
    • 逗号后一个空格,前面无空格
    # Good
    average <- mean(feet / 12 + inches, na.rm = TRUE)
    
    # Bad
    average<-mean(feet/12+inches,na.rm=TRUE)
    

    :,::,:::是例外,它们前后都不要有空格。

    # Good
    x <- 1:10
    base::get
    
    # Bad
    x <- 1 : 10
    base :: get
    

    除了调用函数,其他时候的左括号前留一个空格。

    # Good
    if (debug) do(x)
    plot(x, y)
    
    # Bad
    if(debug)do(x)
    plot (x, y)
    

    为了对齐而增加等号或赋值符前后的空格是可以的。

    list(
      total = a + b + c, 
      mean  = (a + b + c) / n
    )
    

    不要在括号或中括号中随意加空格,除非上面的情况(有逗号)。

    # Good
    if (debug) do(x)
    diamonds[5, ]
    
    # Bad
    if ( debug ) do(x)  # No spaces around debug
    x[1,]   # Needs a space after the comma
    x[1 ,]  # Space goes after comma not before
    

    花括号

    {不要单独开启一行,而应该在之后另起一行。
    }应该单独一行。除非它跟在else后面。

    # Good
    
    if (y < 0 && debug) {
      message("Y is negative")
    }
    
    if (y == 0) {
      log(x)
    } else {
      y ^ x
    }
    
    # Bad
    
    if (y < 0 && debug)
    message("Y is negative")
    
    if (y == 0) {
      log(x)
    } 
    else {
      y ^ x
    }
    

    可以将很短的语句放在同一行。

    if (y < 0 && debug) message("Y is negative")
    

    行宽

    尽量每行少于80个字符。如果你发现写代码的空间不够用了,说明你需要把一些代码放在另一个函数中。

    缩进

    缩进两个空格。
    除非定义函数的时候,可以对齐。

    long_function_name <- function(a = "a long argument", 
                                   b = "another argument",
                                   c = "another long argument") {
      # As usual code is indented by two spaces.
    }
    

    赋值

    <-赋值,而不是=

    # Good
    x <- 5
    # Bad
    x = 5
    

    注释

    每个注释应以一个井号和一个空格开始。每一行注释前后各空一行。完整的句子,大写字母开头,句号结尾。
    注释应解释为什么,而不是什么。

    # How many locations are represented in the dataset.
    
    ds$location %>%
    unique() %>%
    length()
    
    # Identify variables that have a single value.
    
    ds[vars] %>%
    ....
    

    code sections可以全大写标题开始。注释行如果以多于四个的-,=,#结束,就创建了一个code section。不同的code section可以通过 Jump To菜单切换。

    # Section One ---------------------------------
     
     # Section Two =================================
     
     ### Section Three ############################# 
    

    关于R style的包

    styler

    styler包地址
    styler包可以自动将代码转换成符合规定的代码形式。装好后,Rstudio的插件中可以找到。适合已经完成的代码一键转换。

    lintr

    lintr包地址

    install.packages("lintr")

    菜单栏"Tools" -> "Global Options..."-> "Code" -> "Diagnostics" 标签:check "Show diagnostics for R".

    lint一个R文件lintr::lint("test.R"),诊断信息在Marker panel中。

    这个包也包含两个插件。可以将插件和快捷方式绑定: Tools > addins > Browse Addins > Keyboard Shortcuts. 建议用Alt+Shift+L for linting the current source code and Ctrl+Shift+Alt+L to code the package.

    推荐阅读

    1. Writing Good R code and Writing Well
    2. coding with style
    3. tidyverse R style guide 电子书

    相关文章

      网友评论

        本文标题:R基础 | R代码风格规范

        本文链接:https://www.haomeiwen.com/subject/oceolctx.html