美文网首页
2019-05-03

2019-05-03

作者: lixin_ggao | 来源:发表于2019-05-05 20:02 被阅读0次

    创建dataframe:

    ob<-data.frame(x=c(1:97),y=accuracy)
    
    • 注意 是“=”号不是“<-”号,否则会创建以x,y 为名的变量

    ggplot

    • 必须使用dataframe 格式

    NULL 与NA

    • NULL 不占用空间,NA占用空间
    • 注意定义新变量置空时使用NULL

    筛选子集的几种方法

    • df[x,y]直接选取特定的行或列;条件筛选时,which 函数筛选行,select 参数筛选列
    newdf<-df[which(colname1>3), select=c("colname1","colname4","colname7")]
    
    • subset(df, row_condition,select=...)筛选,共三个参数,第一个为进入筛选的源数据,第二个为行条件,第三个为列条件
    select_result<-subset(df, sex=="f"&&age>35,select=c(name,sex,score, course)
    
    • filter() dplyr 包下的函数,其中能对返回值为TRUE的值进行筛选,注意条件无需用&连接,表示或关系时,可用“|”连接
    new_set<-filter(df, month==1, type_f=="3")
    #等价于
    new_set<-df%>%filter(month==1,type_f=="3")
    

    连接数据集

    • merge()函数实现类似sql 的连接操作,注意列名带引号
    conn_dataset<- merge(df1,df2,by.x="name",by.y="name_2") #inner join 
    conn_dataset<- merge(df1,df2,by.x="name",by.y="name_2", all.x=TRUE)# left join
    conn_dataset<- merge(df1,df2,by.x="name",by.y="name_2",all.y=TRUE)#right join 
    conn_dataset<- merge(df1,df2,by.x="name",by.y="name_2", all=TRUE)#outer join 
    

    相关文章

      网友评论

          本文标题:2019-05-03

          本文链接:https://www.haomeiwen.com/subject/vxmanqtx.html