美文网首页
《The Little SAS Book》学习笔记---Chap

《The Little SAS Book》学习笔记---Chap

作者: RSP小白之路 | 来源:发表于2023-09-01 11:23 被阅读0次

    读取分隔符数据文件除了使用data步的infile语句之外,proc import过程步也是非常常用且好用的工具。

    import过程

    import过程的一般格式为:

    proc import datafile = "filename" out =dataset  options ;
    

    import过程有许多选项,下面我们一起学习常用的一些选项。

    • DBMS=选项
      如果文件没有合适的类型,DBMS=选项是import过程步必须的选项,用以指定文件的类型。
    扩展名 DBMS=
    .csv CSV
    .txt TAB
    上述2个以外 DLM
    EXCEL XLSX或者xls

    • REPLACE选项

    再次读入数据是否覆盖上次的,添加REPLACE选项表示覆盖

    上述两个选项一般使用格式:

    proc import datafile = "file" out = dataset DBMS = "xlsx" REPLACE;
    

    可选选项

    • DATAROWS= n

    从第几行开始读取数据,默认第1行。

    • GETNAMES= NO

    是否获取列名(变量名)

    • GUESSINGROWS= n

    使用多少行来确定变量类型,默认20行

    这几个可选选项的一般使用格式:

    proc import datafile = "file" out = dataset DBMS = "xlsx" REPLACE;
    GETNAMES= NO;
    DATAROWS= 2;
    GUESSINGROWS= 1000;
    run;
    

    读取EXCEL文件时的一些选项

    • sheet=选项

    如果一个EXCEL文件包含多个sheet,可以通过sheet= “sheetname”指定要读取的特定sheet


    • range=选项

    也可以在一个sheet中读取特定的区域的数据,通过指定sheet名和目标区域左上角和右下角的单元格range= “sheetname$UL:LR”


    • mixed选项

    有时候一列数据包含字符型数据和数值,数值会被转换为缺失值,添加mixed = YES选项,可以使数值型数据转换为字符型


    以上就是import步比较常用的一些选项了。

    相关文章

      网友评论

          本文标题:《The Little SAS Book》学习笔记---Chap

          本文链接:https://www.haomeiwen.com/subject/myenpdtx.html