美文网首页
用R语言进行数据分析(一)

用R语言进行数据分析(一)

作者: 吃一口小肉丸 | 来源:发表于2020-03-15 01:22 被阅读0次

R的安装、运行与基本操作

以下内容是我在R语言学习过程中的每一课的重点笔记记录。

02  数据分析

数据:是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些符号的组合。

通过数据分析的结果指导决策。

数据分析的一般步骤:

① 数据采集  ②数据存储 (存储于计算机文件,大量数据即数据库)③数据统计:使用统计方法,有目的的对收集到的数据进行分析处理,并解读分析结果(目标明确)。

④数据挖掘:Data Mining,又称为资料勘探、数据采矿,一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程(探索过程)。

⑤数据可视化:图形展示

⑥进行决策

03  数据挖掘

大数据分析的思维转变:

1.要分析与某事物相关的所有数据,而不是依靠分析少量的样本。

2.我们乐于接受数据的纷繁复杂,而不再追求精确性。

3.不再探求难以琢磨的因果关系,转而关注事物的相关关系。

05  R语言

R语言的前身为S语言,S语言可用S-PLUS软件实现。

R语言最开始的目的是为了生物统计与计算。

R语言的优点:

① 有效的数据处理与保存机制

② 拥有一整套数组与矩阵的操作运算符。

③ 一系列完整而又连贯的数据分析工具。

④ 图形统计可以对数据直接进行分析和显示,可用多种图形设备。

⑤ 一种相当完善、简洁和高效的程序设计语言。

⑥ R语言是彻底面向对象的统计编程语言。

⑦ R语言与其他编程语言、数据库之间有很好的的接口。

⑧ R语言是自由的软件,可以放心大胆使用,但其功能却不比其他同类软件差。

⑨ R语言具有丰富的网上资源(R语言官网:r-project.org)

R语言的缺点:

① R语言不够规范,不易上手,需要付出大量的学习成本。

② R的扩展包太多了,需利用较多的时间查找学习。

07  R的安装

R语言官网——点击Download下的CRAN——点击China,选其中任一镜像网站——点击Download R for Windows——点base,再点下载即可

R的安装

08  R的运行

R的运行方式:①交互式 ②R脚本 ③R工作空间

交互式:>为命令提示符,换行时>切换为+表示继续输入,直至补齐括号

R脚本:后缀名为.R的文件

R工作空间,即建立一个Project,相当于建立一个文件夹

在R安装根目录下有一个Rproject.site的文件可以设置R语言默认程序选项,可加上:

.First(),打开包

.Last(),清理操作

09  Rstudio

Rstudio类似python的pycharm,一般在Rstudio中进行R语言数据分析

直接从国外官方网站下载速度太慢,可以从清华镜像下载:mirrors.tuna.tsinghua.edu.cn

在Rstudio中,注意以下:

① ctrl+Enter相当于Run运行按钮

② 上方的Source按钮相当于运行所有代码

③ 放大镜可以进行查找替换

④ Tab键可以自动补齐残缺的代码

⑤ 上方菜单栏里的Tools中Global Options 可以设置Appearance以设置主题外观,包括背景以及字体,字号等

⑥ Ctrl+键盘的向上箭头:可列出之前敲过的命令

⑦ Alt+shift+K:可以查找所有的快捷键

Rstudio

10.  R语言基本操作

(1)getwd():查找工作目录

(2)setwd(dir=”C:/Users/Rdata/”):设置当前工作目录

注:在Windows中为“\”,R中为“/”

(3)list.files():可以查看目录下的文件 dir()也可完成同样的功能

(4)定义变量不可以以数字开头

R中的赋值符号为  <-  ,而并非  =,用=赋值会出问题

此赋值符号可用键盘上的Alt加-输入

例子:y  <-  sum(1,2,3,4,5) 将1,2,3,4,5的总和值赋给变量y

5  ->  x 将5向右赋值给x

X  <<-  5 将5强行赋值给一个全局变量,而并非局部变量

(5)ls():列出当前所有的变量

(6)ls.str():列出当前每个变量的详细信息

(7)str(x):列出x变量的详细信息

(8)ls(all.names=TRUE):找出以.命名的所有文件,包括以.开头的

(9)rm(x)删除变量x

(10)rm(list=ls()):一次删除所有的变量

(11)history():可列出所有的历史记录

(12)history(5):只列出最近5条历史记录

(13)ctrl+L:清屏

(14)save.image():保存当前空间

(15)q()退出

相关文章

网友评论

      本文标题:用R语言进行数据分析(一)

      本文链接:https://www.haomeiwen.com/subject/ndwashtx.html