美文网首页
ruby编码说明【转】

ruby编码说明【转】

作者: 难道_fa74 | 来源:发表于2017-08-11 00:40 被阅读0次

    程序编码一般分几种情况:

    1. 源码文件编码
    2. 接收外部内容的编码
    3. 运行环境编码
    4. 操作系统编码

    首先源码文件的编码,可以通过在ruby文件的头部添加一行申明即可,这样所有在源码里面出现的字符都保存为指定的编码:

    # -*- coding:utf-8 -*-  
    

    接收的内容或读取外部文件时,可能不确定是什么编码,这个时候就可以对外部接收的字符或内容进行转码。

    string.encode('utf-8')   #把字符串转成utf-8模式  
    string.force_encoding('utf-8')  #把字符串强制转成utf-8模式
    require "nkf"  
    string= NKF.nkf("-w", string)  ##同样把字符串转成utf-8,其值-w参数代表utf-8  
    

    运行环境的编码,通常默认和操作系统的编码是一致的,但是也可以设置为指定的编码,这样保持所有编码一致性。ruby中设定运行环境编码方式如下,即启动ruby时添加encoding参数并指定编码格式。

    ruby --encoding=utf-8  
    

    操作系统编码,通常中文的都是GBK的;所以如果在程序里用到系统中的取值时用到中文的地方需要注意;比如:中文名字的目录;如果你的运行环境是utf-8的,读取中文目录下的文件时,需要把路径字符串转码成gbk再去读,否则会报错。

    在这里有一个问题:
    ruby x:/path/to/ruby/中文/file.rb #可以成功找到rb文件,此时运行环境编码为gbk
    ruby --encoding=utf-8 x:/path/to/ruby/中文/file.rb #不能找到rb文件,提示编码错误,因为此时运行环境编码为utf-8,而传递过去的路径参数为gbk编码。
    而如果运行环境为gbk时,而源码为utf-8编码,则在有些地方处理中文等字符串时会提示编码不兼容,因为有些时候字符编码处理的默认编码就是运行环境的编码。
    ruby x:/path/to/ruby/english/file.rb #可以找到,运行环境同源码设置编码

    所以运行环境的编码应该有如下优先级:是否有encoding参数指定==>第一次处理非中文时的字符编码格式

    相关文章

      网友评论

          本文标题:ruby编码说明【转】

          本文链接:https://www.haomeiwen.com/subject/henkrxtx.html