2.9 混合读取方式

每种数据读取方式都有其优势，list最简单，column和formatted虽然复杂但是不要求变量之间的空格，并且变量名中可以包含变量，而且formatted可以读取特殊的数据比如日期。SAS可以灵活的让你搭配不同的读取方式，以达到最大的方便。

例子如下的原始数据记录了美国国家公园的信息：姓名（name）、所属周（state）、建立时间（year established）、占地面积（size inacre）：

有多种方式进行数据读取，下面的程序是方式之一：

其中ParkName是column方式读取，State和Year是list方式读取，Acreage是formatted方式读取，输出结果如下所示：

混合读取方式有时会遇到问题：SAS通过一个指示器标注位置，来读取原始数据的一行，但每种读取方式对指示器的使用稍有不同。List方式下，SAS自动找到非空格区域并开始读取；column方式下，SAS读取你所指定的特定位置；informatted方式下，SAS不理会指示器的标准，只是依次的读取。这时，就会需要列指示器@n，来人为的让SAS的读取直接跳至某列。

在上面的程序中，列指示器@40告诉SAS在读取Acerage变量之前，移动到第40列去，如果移去指示器，程序为：

输出结果如下图所示：

之所以出现这样的结果，要看原始文件的列坐标排列：

Comma9告诉SAS读取9列，SAS就会读取包括空格在内的9列，这便会导致输出结果的问题。

2.10 读取凌乱的原始数据

有的数据排列混乱，长度不一。这样的数据需要新的工具处理：@’character’ 列指示器和colon modifier。

@’character’ 列指示器 2.9中提到@column列指示器可以让SAS直接从某列开始读取数据。但有时候你不知道要读取的数据是从哪列开始，此时你只要知道要读取的数据的前面那个字符或单词即可。比如有一个关于狗的原始文件，你想要读取狗的品种号，但文件排列很凌乱，只知道品种号跟随在单词breed后面，那么可以用如下方式读取：

Input @’Breed:’ DogBreed $;

colon modifier 由于input读取字符串变量默认为8个字符，因此在上例中如果狗的品种名（dogbreed）超过8个字符，则需要定义长度，定义为$length，在该长度中，空格也算在内。如果要使SAS读取过程中遇到空格则不再继续读取，则要在$length前面加冒号“:”。比如原始数据中有这么一行：

My dog Sam Breed:Rottweiler Vet Bills:$478

如果用上述不同方法读取，会有不同结果：

例子 web日志是凌乱数据的一个很好例子，下面是一个网站的web日志，数据开始于访问IP，后面有访问日期、访问文件名等信息。

现在想要读取访问日期和访问的文件名，但是它们每行中所占据的列的位置都不同，而且文件名的长度每行都不一样，那么SAS读取这种文件通过如下方式：

@’[’作为列指示器，告诉SAS读取[之后的内容，@’GET’告诉SAS读取GET之后的内容，由于文件名作为字符串变量，这里基本都会超过8个字节，因此后面附加:$20。输出结果如下：

2.11 跨行观测值的读取方式

一般原始文件中一行代表一个观测值，有时会出现一个观测值跨行的情况。由于SAS会自动转到下一行读取数据，直到读取这个观测的所有变量（input语句中给出），所以你需要告诉SAS什么时候不要换行，以便在日志中不出现SAS-went-to-a-new-line的暂停说明，此时需要在INPUT语句中加行指示器。（？？？？）

行指示器，斜线/：告诉SAS跳至原始数据的第二行；#n：跳至第n行，n代表原始数据中某观测值的行数（#2则让SAS跳至某观测值的第二行），#n不能用来回跳。

例子有一组关于温度的数据，temperature.dat第一行代表城市和州，第二行代表本日最高温和最低温，第三行代表史上最高温和最低温。

用如下的程度来读取这份数据：

Input后面告诉SAS读取第一行的city变量和state变量，斜线/告诉SAS移动到下一行的第一列，以便读取normalhigh和normallow。#3告诉SAS移动到第三行的第一列以便继续读取观测值的recordhigh变量和recordlow变量。这里/可以用#2代替，也可以用/代替#3。日志记录如下：