美文网首页
R语言(2) 入门

R语言(2) 入门

作者: 无事扯淡 | 来源:发表于2017-07-31 16:56 被阅读0次

    1.条件与循环语句

    • 条件语句

    if

    语句形式

    if (condition) {
      expr
    } else if (condition){
    }
    ...
    else {
    }
    

    例子:

    
    num_views <- 14
    # Control structure for num_views
    if (num_views > 15) {
      print("You're popular!")
    }else{
      print("Try to be more visible!")
    }
    
    ifelse
    > ifelse(2>1,'haha','zzzz')
    [1] haha
    
    switch

    switch相当于一个函数,而且这个函数第一个表达式只能是字符类型。

    >  name <- 'john'
    >  switch(name,john = 'Hello John', zeus = 'Hello zeus','Hello')
    [1] Hello John
    

    上面name要寻找到与其匹配的变量名就会返回等号后面的表达式,如果匹配到变量名而等号后没有值,那就会就从后面一个表达式返回。如果没有变量名的表达式,就是默认值,不允许有两个默认值。

    > switch(name,john = , zeus = 'Hello zeus','Hello')
    [1] "Hello zeus"
    

    一个小例子,根据factor变量输出:

    > sex <- factor(c('M','F'))
    > switch(as.character(sex[1]),M = 'male',F = 'female')
    [1] male
    

    这个例子里面需要把factor变量就行类型转换,否则会报错。

    • 循环语句
    while
    x <- 10
    while(i>0){
      print('Hello')
      x <- i - 1
    }
    

    for
    for(i in 1:10){
    }
    

    2.factor

    factor有人翻译成因子,根据语法这有点类似c语言中的枚举,这里就不翻译了。在数据中某些字段自会是一些可选字段中的某个值,那么就可以用factor,比如说人的性别就可以用factor。

    • 建立factor
    > gender_vector <- c("Male", "Female", "Female", "Male", "Male")
    > factor_gender_vector <-factor(gender_vector)
    > factor_gender_vector
    [1] Male   Female Female Male   Male  
    Levels: Female Male
    > mode(factor_gender_vector)
    [1] "numeric"
    

    上面的测试可以看出factor变量其实是个数值类型。

    • 有序
      对于factor类型的变量,可以有序也可以无序。上面的例子中性别就是无序的,如果考虑温度的低、中、高的问题,那么factor就是有序的。
    > temperature_vector <- c("High", "Low", "High","Low", "Medium")
    > factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
    > factor_temperature_vector
    [1] High   Low    High   Low    Medium
    Levels: Low < Medium < High
    
    • 修改名称
    > survey_vector <- c("M", "F", "F", "M", "M")
    > factor_survey_vector <- factor(survey_vector)
    > factor_survey_vector
    [1] M F F M M
    Levels: F M
    

    上面的示例代码自动生成的factor是F,M,显然我们可以把它改成更有意义的名字。

    > levels(factor_survey_vector) <- c('女','男')
    > factor_survey_vector
    [1] 男 女 女 男 男
    Levels: 女 男
    
    • 查看变量信息
    > mode(factor_survey_vector)
    [1] "numeric"
    > summary(factor_survey_vector)
    Female   Male 
         2      3
    > summary(survey_vector)
       Length     Class      Mode 
            5 character character
    

    mode查看数据类型,summary查看数据信息。

    3. DataFrame

    DataFrame类似于数据库中的表或者是pandas中的DataFrame。

    • 查看数据
    > head(mtcars)#从头列出部分数据
    > str(mtcars)#查看数据信息
    'data.frame':   32 obs. of  11 variables:
     $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
     $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
     $ disp: num  160 160 108 258 360 ...
     $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
     $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
     $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
     $ qsec: num  16.5 17 18.6 19.4 17 ...
     $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
     $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
     $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
     $ carb: num  4 4 1 1 2 1 4 2 2 4 ...
    
    • 创建DataFrame
    # Definition of vectors
    name <- c("Mercury", "Venus", "Earth", "Mars", "Jupiter", "Saturn", "Uranus", "Neptune")
    type <- c("Terrestrial planet", "Terrestrial planet", "Terrestrial planet", 
              "Terrestrial planet", "Gas giant", "Gas giant", "Gas giant", "Gas giant")
    diameter <- c(0.382, 0.949, 1, 0.532, 11.209, 9.449, 4.007, 3.883)
    rotation <- c(58.64, -243.02, 1, 1.03, 0.41, 0.43, -0.72, 0.67)
    rings <- c(FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, TRUE, TRUE)
    
    # Create a data frame from the vectors
    planets_df <-data.frame(name,type,diameter,rotation,rings)
    
    • 元素选择
    # 查找单个元素第一行第三列
    > print(planets_df[1,3])
    [1] 0.382
    #查找第四行,注意这里选择一行所有列的写法
    > print(planets_df[4,])
      name               type diameter rotation rings
    4 Mars Terrestrial planet    0.532     1.03 FALSE
    #查找第四行,2,3,4列,类似于切片操作
    > print(planets_df[4,2:4])
                    type diameter rotation
    4 Terrestrial planet    0.532     1.03
    #使用列名获取数据
    > planets_df[1:5,'diameter']
    [1]  0.382  0.949  1.000  0.532 11.209
    #使用列名获取一列数据
    > planets_df['diameter']
      diameter
    1    0.382
    2    0.949
    3    1.000
    4    0.532
    5   11.209
    6    9.449
    7    4.007
    8    3.883
    #使用简化写法获取一列数据
    > planets_df$diameter#与planets_df[,"diameter"]相同
    [1]  0.382  0.949  1.000  0.532 11.209  9.449  4.007  3.883
    #这里要注意上面和下面的差异,为何一个竖排和一个竖排输出,原因就是上面输出的是list,下面的是numberic。
    
    • 条件选择
      上面的例子中,有些行星有行星环,有些没有,如何获取有环的行星名字。
    > rings_vector <- planets_df$rings
    > rings_vector
    [1] FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE
    > planets_df[rings_vector, "name"]
    [1] Jupiter Saturn  Uranus  Neptune
    Levels: Earth Jupiter Mars Mercury Neptune Saturn Uranus Venus
    #要获取没环的行星名字,使用!操作取反。
    #一个不输入name,直接获取整个筛选数据表。
    

    使用subset来获取子集,选择直径小于的1的行星

    >  subset(planets_df, subset = diameter < 1)
         name               type diameter rotation rings
    1 Mercury Terrestrial planet    0.382    58.64 FALSE
    2   Venus Terrestrial planet    0.949  -243.02 FALSE
    4    Mars Terrestrial planet    0.532     1.03 FALSE
    
    • 排序
      使用order函数进行排序,整个函数返回的排序之后的位置。
    > a = c(2,3,1)
    > order(a)
    [1] 3 1 2
    > a[order(a)]
    [1] 1 2 3
    

    根据直径进行排序

    > positions <- order(planets.$diameter)
    > planets[positions,]
    

    相关文章

      网友评论

          本文标题:R语言(2) 入门

          本文链接:https://www.haomeiwen.com/subject/kzbllxtx.html