《The Little SAS Book》学习笔记---Chap

作者: RSP小白之路 | 来源:发表于2023-09-01 11:23 被阅读0次

读取分隔符数据文件除了使用data步的infile语句之外，proc import过程步也是非常常用且好用的工具。

import过程

import过程的一般格式为：

proc import datafile = "filename" out =dataset  options ;

import过程有许多选项，下面我们一起学习常用的一些选项。

再次读入数据是否覆盖上次的，添加REPLACE选项表示覆盖。

上述两个选项一般使用格式：

proc import datafile = "file" out = dataset DBMS = "xlsx" REPLACE;

可选选项

从第几行开始读取数据，默认第1行。

是否获取列名（变量名）。

使用多少行来确定变量类型，默认20行。

这几个可选选项的一般使用格式：

proc import datafile = "file" out = dataset DBMS = "xlsx" REPLACE;
GETNAMES= NO;
DATAROWS= 2;
GUESSINGROWS= 1000;
run;

如果一个EXCEL文件包含多个sheet，可以通过sheet= “sheetname”指定要读取的特定sheet。

也可以在一个sheet中读取特定的区域的数据，通过指定sheet名和目标区域左上角和右下角的单元格，range= “sheetname$UL:LR”。

有时候一列数据包含字符型数据和数值，数值会被转换为缺失值，添加mixed = YES选项，可以使数值型数据转换为字符型。

以上就是import步比较常用的一些选项了。

本文标题：《The Little SAS Book》学习笔记---Chap

本文链接：https://www.haomeiwen.com/subject/myenpdtx.html