1、查看系统位数
lsb_release -a 或者 getcong LONG_BIT
image2、系统编码问题
在 linux中操作windows下的文件,可能会遇到编码问题。因为Windows中默认的文件格式是 cp936(通常被视为等同 GBK), 而Linux一般都是UTF-8。
在linux终端显示乱码,可以调一下secureCRT session的编码 (GBK <--> UTF8/GB2312)
3、读取某路径下的所有文件内容
一种方式:确定文件个数,且文件名格式确定,循环遍历
二种方式:ls将所有文件名定向到.txt,使用awk/脚本解析出文件名。这个时候仍是多个文件,可采用标准输入输出方式,采用管道重定向方式:cat 路径/* | python *.py
三种方式:cat 路径/* | awk '{print $0}' > res。
4、awk支持指定字符串分隔符
awk -F'hdfs' '{print "hadoop fs -text hdfs" $3 "> " NR}' direct.txt | head -10
5、tar
tar czvf $tgzName.tgz $tgzName
tar xzvf $tgzName.tgz $tgzName
主选项:【一条命令以下5个参数只能有一个】
-c: --create 新建一个压缩文档,即打包
-x: --extract,--get解压文件
-t: --list,查看压缩文档里的所有内容
-r:--append 向压缩文档里追加文件
-u:--update 更新原压缩包中的文件
辅助选项:
-z:是否同时具有gzip的属性?即是否需要用gzip压缩或解压?一般格式为xxx.tar.gz或xx.tgz
-j:是否同时具有bzip2的属性?即是否需要用bzip2压缩或解压?一般格式为xx.tar.bz2
-v:显示操作过程!这个参数很常用
-f:使用文档名,注意,在f之后要立即接文档名,不要再加其他参数!
-C:切换到指定目录
--exclude FILE:在压缩过程中,不要将FILE打包
6、free
查看机器内存
网友评论