美文网首页
第一部分第4章 基本数据管理

第一部分第4章 基本数据管理

作者: Hannahhao | 来源:发表于2020-05-28 14:18 被阅读0次

4.1 一个示例


4.2 创建新变量

变量名 <- 表达式

运算符 描述
+
-
*
/
^ or ** 求幂
x%%y 求余
x%/%y 整数除法

transform函数:创建新变量并将其保存到数据框中。

4.3 变量的重编码

重编码:根据同一个变量和或其他变量的现有值创建新值的过程。
逻辑运算符

运算符 描述
<, <=, > , >=, ==, != 小于,小于等于,大于,大于等于,等于,不等于
!x 非x
x 管道符 y x或y
x&y x和y
isTRUE(x) 测试x是否为TRUE
#创建agecat变量
leadership$agecat[leadership$age > 75] <- "Elder"
leadership$agecat[leadership$age >= 55 &leadership$age <=75] <- "Middle Aged"
leadership$agecat[leadership$age < 55] <- "Young"
leadership

4.4 变量的重命名

names()函数重命名变量
plyr包中rename()函数修改变量名,使用格式为:rename(dataframe, c(oldname="newname",...)

4.5 缺失值

缺失值NA:Not Available,不可用。
函数is.na()允许检测缺失值是否存在



Two things are very important:

  • 缺失值被认为是不可比较的
  • R并不把无限的或者不可能出现的数值标记成缺失值。不可能的值用NaN not a number来标记。

4.5.1 重编码某些值为缺失值

4.5.2 在分析中排除缺失值

含有缺失值的算术表达式和函数计算结果也是缺失值。
函数na.omit()移除所有含有缺失值的观测。

4.6 日期值

函数as.Date()用于执行转化字符串形式的日期值为数值形式。
as.Date(x, "input_format")

符号 含义 示例
%d 数字表示的日期(0~31) 01~31
%a 缩写的星期名 Mon
%A 星期名 Monday
%m 月份(00~12) 00~12
%b 缩写的月份 Jan
%B 月份 January
%y 两位数的年份 07
%Y 四位数的年份 2007

日期值的默认输入格式为yyyy-mm-dd
Sys.Date()返回当天的日期
date()返回当前的日期和时间
difftime()来计算时间间隔

4.6.1 将日期转换为字符型变量

as.character()

4.6.2 进一步了解

help(as.Date)

4.7 类型转换

判断 转换
is.numeric() as.numeric()
is.character() as.character()
is.vector() as.vector()
is.matrix() as.matrix()
is.data.frame() as.data.frame()
is.factor() as.factor()
is.logical() as.logical

4.8 数据排序

order函数对一个数据框进行排序,默认升序,前面加一个减号降序。

4.9 数据集的合并

4.9.1 向数据框添加列

merge()函数
cbind()函数横向合并

4.9.2 向数据框添加行

rbind()函数(必须拥有相同的变量)

4.10 数据集取子集

4.10.1 选入或保留变量

dataframe[row indices, column indices]

4.10.2 剔除或丢弃变量

逻辑运算符!

4.10.3 选入观测

4.10.4 subset函数---最简单的选择变量和观测的方法

4.10.5 随机抽样

sample()函数

4.11 使用SQL语句操作数据框

skip

4.12 小结

相关文章

  • [R语言]Chapter 4 基本数据管理

    Chapter4 基本数据管理 这是我对基本数据管理部分的笔记,总的来说,能够ren 一个示例创建leadersh...

  • 【R实战 入门】五、高级数据管理

    这里是佳奥!让我们继续R的数据管理学习! 本篇分为三个基本部分。 在第一部分中,我们将快速浏览R中的多种数学、统计...

  • 第一部分第4章 基本数据管理

    4.1 一个示例 4.2 创建新变量 变量名 <- 表达式 运算符描述+加-减*乘/除^ or **求幂x%%y求...

  • 数据库复习总结

    第一章: 数据是数据库中存储的基本对象 数据是描述事物的符号记录 数据库技术一般包含数据管理和数据处理两部分 数据...

  • 像学R一样学Python(高级数据管理)

    温故 在基本数据管理部分,主要是涉及到如何新建数据集,并且对数据集中的变量和观测值进行提取和操作。基本上用到了如下...

  • 《R语言实战》学习笔记目录

    第一章R语言介绍 第二章创建数据集 第三章图形初阶 第四章基本数据管理 第五章高级数据管理 第六章基本图形 因小鑫...

  • 第4章 基本数据管理

    《R语言实战》笔记系列 本章学习大纲 1.操纵日期和缺失值 2.熟悉数据类型和转换 3.变量的创建和重编码 4.数...

  • R action 4

    20171205(从有道迁移) 基本数据管理 创建新变量格式:变量名←表达式,“表达式”部分可以包含多种运算符和函...

  • R语言实战__第4章 基本数据管理

    第4章 基本数据管理 4.1 一个示例 关于男性和女性在领导方式上的不同。代码清单4-1 创建leadership...

  • Enterprise Data At HUAWEI(二)

    建立公司级的数据治理政策(?) 华为数据管理总纲 华为数据管理总纲明确了数据治理最基本的原则,包括信息架构、数据产...

网友评论

      本文标题:第一部分第4章 基本数据管理

      本文链接:https://www.haomeiwen.com/subject/utboahtx.html