基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课
新建文件夹,新开一个项目
打开Rstudio
- 右上角新建progect.R
- getwd() # 查询当前工作目录
- 新建Rscript脚本,Ctrl+Shift+N
- Ctrl+s保存
基本常用操作
- Console界面。Ctrl+l 清空界面
- 数据导入
Environment窗口 → import dataset → From test(base)就好
name 变量名
Encoding 若有中文内容,建议选utf-8,纯英文不用改
可复制在Console窗口生成的command到脚本中,用于下一次调用
绝对路径
常用基本命令
- 赋值 <-
gene_total <- 0 - 数组、列表 → 向量 c( )
gene <- c(30, 40, 60)
中间用逗号隔开
可迭代对象 - 循环 for ( ) { }
for (i in gene) {gen_total <- gene_total + 1} - apply函数 列表求和
sample_sum <- apply(table, 1, sum)
apply第二参数 1 按行算; 2 按列算
- 保存数据
write.csv(sample_sum, file = 'sample_sum.csv')
计算样本间相关系数
- cor(table) # 计算表格列索引各项间相关系数
相关系数接近1表示更相关 - 相关系数可视化
library(pheatmap) # pheatmap软件包
pheatmap(sample_cor) # 需要调整些参数才好看
数据结构
- 标量
零维 - 向量(数组)
一维
R语言学习结构
- 输入 → 分析、画图 → 输出
- 数据结构
- 数据类型
- 基本运算+-*/等
- 函数
- package
- 流程控制 循环、条件、线性流程等
- 数据处理的一类软件包 tidyverse
- 画图软件包
- 输出 文本、图片
需要安装的软件包
要安装的R软件包-题外话
- biomaRt
非模式物种不能用,不能存取
网友评论