行列剔除
df[,-3] df[]-2,
删除rm
撤销 Ctrl+Z
新建一个文件 Ctrl+Shift+N
保存当前文件 Ctrl+S
关闭当前文件 Ctrl+W
加载包库library(reshape2)
melt()把宽格式数据转为长格式
dcast()把长格式转换为宽格式
df <- melt(data,id.vars= 'N' ,variable.name='' ,value.name='')
整合 library(tidyr)
gather()
spread()更简洁,长变宽
install.packages("installr") # 下载并安装 installr 包
library(installr) # 装载 installr 包
install.RStudio() # 下载并安装 RStudio IDE
install.Rtools() # 你需要 Rtools 来构建自己的包
install.git() #git 提供了代码的版本控制功能
detach(),这是library()的反向操作
detach()参数为detach(package:包的名称)
删除包remove.packages()
查询加载的包:search()
.libPaths()能够显示库所在的位置
library()显示库中有哪些包
查看已经安装的包:函数installed.packages()
包的更新update.packages()
查看当前已经加载过的包:(.packages())
显示所有可用的包:(.packages(all.available=TRUE))
数据导入
以下R包主要用于数据导入和保存数据
feather:一种快速,轻量级的文件格式。在R和python上都可使用
readr:实现表格数据的快速导入。中文介绍可参考这里
readxl:读取Microsoft Excel电子表格数据
openxlsx:读取Microsoft Excel电子表格数据
googlesheets:读取google电子表格数据
haven:读取SAS,SPSS和Stata统计软件格式的数据
httr:从网站开放的API中读取数据
rvest:网页数据抓取包
xml2:读取HTML和XML格式数据
webreadr:读取常见的Web日志格式数据
DBI:数据库管理系统通用接口包
RMySQL:用于连接MySQL数据库的R包
RPostgres:用于连接PostgreSQL数据库的R包
bigrquery用于连接Google BigQuery的R包
PivotalR:用于读取Pivitol(Greenplum)和HAWQ数据库中的数据
dplyr:提供了一个访问常见数据库的接口
data.table:data.table包的fread()函数可以快速读取大数据集
git2r:用于访问git仓库
以下R包主要用于数据整理,以便于你后续建模分析:
tidyr:用于整理表格数据的布局
dplyr:用于将多个数据表连接成一个整齐的数据集
purrr:函数式编程工具,在做数据整理时非常有用。
broom:用于将统计模型的结果整理成数据框形式
zoo:定义了一个名zoo的S3类型对象,用于描述规则的和不规则的有序的时间序列数据。
网友评论