美文网首页
在shell or R 中判断一个文件是否为空。

在shell or R 中判断一个文件是否为空。

作者: 记号晴系 | 来源:发表于2020-08-30 21:01 被阅读0次

    1. shell 中判断文件是否存在或者是否为空文本

    在lunix中写脚本时,总免不了判断文件是否存在,文件内容是否为空的等操作。而这些操作都可以用test指令来实现,可通过man test进行查看相关指令。

    #! /bin/sh
    if test -s file.txt;then
              echo "hi"
    else
            echo "empty"
    fi
    ### 另外一个等同的
    #! /bin/sh
    if  [ -s file.txt ];then
              echo "hi"
    else
            echo "empty"
    fi
    

    -f判断是不是文件; -d判断是不是目录;-e判断文件/目录是否存在;-s判断文件长度是否不为0,当-s后面跟目录是,总是返回真

    2. R语言文件操作

    R语言的基础函数中也囊括了文件夹和文件的基本操作函数,由于使用R的过程中会常常需要与文件打交道,因此一些基本的文件操作函数在实际使用中是十分常见的,这里做了一些简单的整理。

    2.1 构建文件路径:

    file.path(..., fsep = .Platform$file.sep)
    

    file.path用于构建文件路劲,默认会使用.Platform$file.sep作为文件分隔符,因此可以实现跨平台操作,该函数实际较为常用。

    #按向量中元素对应的位置生成文件路劲
    file.path(c('C:', 'D:'), c('R_script', 'R_data'))
    

    2.2 列出路劲下的文件/目录 :

    #列出当前目录下的文件和文件夹
    list.files(path = ".", pattern = NULL, all.files = FALSE,
    full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
    #列出当前目录下的文件和文件夹
    dir(path = ".", pattern = NULL, all.files = FALSE,
    full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
    #列出当前目录下的所有子目录,默认recursive = TRUE
    list.dirs(path = ".", full.names = TRUE, recursive = TRUE)
    
    • path – 字符串表示的路劲全名,默认为当前工作路劲;
    • pattern – 查找的文件名,支持正则表达式;
    • all.files – 逻辑值,FALSE(默认)仅仅返回可见的文件名,TRUE返回文件全名;
    • full.names – 逻辑值,FALSE(默认)仅返回文件名,TRUE返回文件名包括路劲;
    • recursive – 逻辑值,FALSE(默认)仅返回当前目录下文件,TRUE递归的扫描所有目录下的文件;
    • ignore.case – 逻辑值,FALSE(默认)文件名大小写敏感,TRUE忽略大小写;
    • include.dirs -逻辑值,FALSE(默认)不添加子目录名,TRUE加入子目录名称;
    • no.. – 逻辑值,FALSE(默认)不排除‘.’和‘..’,TRUE为排除;

    返回给定路劲下文件名或文件夹组成的字符向量,如果没有返回空字符。如果给定的路劲不存在,或为非法路劲或没有读取权限,返回空字符。list.dirs隐式的包含all.files = TRUE。

    2.3 创建文件夹及设置权限

    path.expand(path)
    dir.create(path, showWarnings = TRUE, recursive = FALSE, mode = "0777")
    dir.exists(paths)
    Sys.chmod(paths, mode = "0777", use_umask = TRUE)
    Sys.umask(mode = NA)
    
    • path – 字符串表示的路劲,路劲已经过path.expand处理

    • paths – 字符向量包含文件名或路劲, 路劲已经过path.expand处理

    • showWarnings – 逻辑值,是否提示错误信息;

    • recursive – 逻辑值,是否创建子目录

    • mode – 八进制表示的权限,r=4,w=2,x=1 (windows环境下该参数无效)

    • use_umask – 逻辑值,mode是否受umask 设置的限制;

    #例子
    #读取环境变量R_USER,返回C:/Users/XXXX/Documents
    Sys.getenv('R_USER')
    #使用home path替换波浪号,返回C:/Users/XXXX/Documents/foo
    path.expand("~/foo")
    
    #在当前工作目录下创建文件夹testfolder
    dir.create(file.path(getwd(), 'testfolder'))
    #默认的recursive为FALSE,创建子目录失败
    dir.create(file.path(getwd(), 'testfolder2', 'subfolder'))
    #文件夹不存在返回FALSE
    dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))
    #设置recursive为TRUE,创建子目录
    dir.create(file.path(getwd(), 'testfolder2', 'subfolder'), recursive = TRUE)
    #创建成功返回TRUE
    dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))
    
    #设置文件目录的最大权限
    Sys.chmod(list.dirs("."), "777")
    

    2.4 查询和设置R包使用路径

    .libPaths(new)
    

    不带参数时.libPaths()会显示当前使用的R包路劲,设置参数可用于设置当前R包路径,对于安装多版本R语言的情况,可以通过使用.libPaths设置使用的R包路劲。

    #例子
    #设置R包路劲为R-3.2.2下的library
    .libPaths("C:/Users/XXXX/Documents/R/R-3.2.2/library")
    

    2.5文件处理

    file.create(..., showWarnings = TRUE)
    file.exists(...)
    #成功返回0,失败返回-1
    file.access(names, mode = 0)
    file.remove(...)
    #删除文件及目录
    unlink(x, recursive = FALSE, force = FALSE) 
    file.rename(from, to)
    file.append(file1, file2)
    file.copy(from, to, overwrite = recursive, recursive = FALSE, copy.mode = TRUE, copy.date = FALSE)
    file.show(..., header = rep("", nfiles),title = "R Information", delete.file = FALSE, pager = getOption("pager"), encoding = "")
    file.symlink(from, to)
    file.link(from, to)
    Sys.junction(from, to)
    
    • from, to - 字符串向量表示的文件或路径
    • overwrite - 逻辑值,是否覆盖已存在的文件
    • showWarnings – 逻辑值,出错是否显示warning信息
    • recursive – 逻辑值,是否复制子目录文件
    • copy.mode - 逻辑值,是否同时复制文件权限
    • copy.date – 逻辑值,是否保留文件日期
    • mode – 接入模式,0,是否存在;1,是否可执行(windows没有可执行概念, 后缀为.exe, .bat, .cmd或.com的文件会被视为可执行文件);2,是否可写;4,是否可读;
    #文件不存在则创建文件,存在则覆盖之前的文件
    file.create('cretestfile.txt')
    #判断文件是否存在,返回TRUE
    file.exists('cretestfile.txt')
    #默认mode = 0判断文件是否存在,存在返回0
    file.access('cretestfile.txt')
    #删除文件cretestfile.txt,文件不存在会返回warning信息
    file.remove('cretestfile.txt')
    
    #读取bin目录下所有文件及目录
    d <- dir(file.path(R.home(), "bin"))
    #读取bin目录下所有文件及目录(包含全路径)
    df <- dir(file.path(R.home(), "bin"), full.names = TRUE)
    #列出所有存在的文件
    d[file.access(df, 0) == 0]
    #列出所有可执行文件
    d[file.access(df, 1) == 0]
    #列出所有可写文件
    d[file.access(df, 2) == 0]
    #列出所有可读文件
    d[file.access(df, 4) == 0]
    
    #创建并写入数据到文件A.txt和B.txt
    cat("file A\n", file = "A.txt")
    cat("file B\n", file = "B.txt")
    cat("file C\n", file = "C.txt")
    #添加文件C.txt的内容到A.txt和B.txt
    file.append(c("A.txt", "B.txt"), "C.txt")
    #修改文件名C.txt为D.txt
    file.rename("C.txt", "D.txt")
    #复制D.txt中的内容10遍,添加到文件A.txt和B.txt各5次
    file.append(c("A.txt", "B.txt"), rep("D.txt", 10))
    #读取文件A.txt和B.txt的内容
    file.show(c("A.txt", "B.txt"))
    #复制文件D.txt到C.txt
    file.copy("D.txt", "C.txt")
    #C.txt已存在,设置overwrite = TRUE进行覆盖
    file.copy("D.txt", "C.txt", overwrite = TRUE)
    #新建tmp文件夹,并拷贝A.txt和B.txt到tmp文件夹下
    dir.create("tmp")
    file.copy(c("A.txt", "B.txt"), "tmp")
    #删除tmp文件夹
    unlink("tmp", recursive = TRUE)
    #删除文件
    unlink(c("A.txt", "B.txt", "C.txt","D.txt"))
    

    文件信息查询
    file.info(..., extra_cols = TRUE)
    file.mode(...)
    file.mtime(...)
    file.size(...)

    file.info返回文件相关信息:

    • size – doule类型,表示文件大小Bytes

    • isdir – 逻辑值,表示是否文件夹或者文件

    • mode – 8进制表示的权限,r=4,w=2,x=1

    • mtime – 最近一次修改的时间

    • ctime – 最近一个状态改变的时间,例如在写入文件、更改所有者、权限、属性或链接设置,mtime的改变必然导致ctime的改变

    • atime -读取文件或者执行文件时更改

    • exe – 可执行类型,返回值包含no,msdos, win16, win32, win64 和unknown

    ~~~R
    #返回当前目录下所有文件及目录的信息
    file.info(list.files())
    #返回当前目录下所有文件的mode
    file.mode(list.files())
    file.info(list.files())$mode
    #返回当前目录下所有文件的最近一次修改时间
    file.mtime(list.files())
    file.info(list.files())$mtime
    #返回当前目录下所有文件的大小,目录size返回为0
    file.size(list.files(()))
    file.info(list.files())$size
    

    相关文章

      网友评论

          本文标题:在shell or R 中判断一个文件是否为空。

          本文链接:https://www.haomeiwen.com/subject/ppylsktx.html