美文网首页R for data science
dplyr 1.0 更新内容大概记录

dplyr 1.0 更新内容大概记录

作者: 热衷组培的二货潜 | 来源:发表于2020-06-06 22:59 被阅读0次

    dplyr 1.0 更新内容大概记录

    最前面的话

    2020/5/31

    • vignette("grouping") 介绍了当应用于分组数据时候,dplyr 怎么变化的。

    Grouped data

    • vignette("programming")已经完全重写,以反映最新的词汇表、最新的 rlang 特性和当前的建议。现在用 dplyr 编程应该会简单很多。

    Programming with dplyr

    <a name="10cfcd06"></a>

    Minor improvements and bug fixes

    • ?dplyr_extending
    • dplyr 不再提供 all.equal.tbl_df() 方法。
    • coalesce()

    df_patch (via coalesce) is too picky about types

    • distinct() 在处理不存在的变量时候会报错,之前是警告
    • filter()、mutate()、summarise() 提供了更详细的报错信息
    • 当所有列均为逻辑向量时,filter() 处理数据框结果通过用 减少它们。意味着我们可以结合 acrossfilter() 函数

    filter() and data frame results, filter(across())

    • left_join()、right_join()、full_join() 增加了新参数 kepp ,可以选择保留这两组连接键。当我们想要确定哪一行在每一个数据丢失时非常有用。

    outer joins don't keep join columns from both sides

    • *join() 函数增加了 by = character() 来进行数据合并

    [https://github.com/tidyverse/dplyr/issues/4206](Problems writing cross-join in dplyr)

    • group_by(..., .add = TRUE) 取代了 group_by(..., add = TRUE)

    相关文章

      网友评论

        本文标题:dplyr 1.0 更新内容大概记录

        本文链接:https://www.haomeiwen.com/subject/lexqtktx.html