react native: js语法 字符串的扩展

作者: wg689 | 来源:发表于2017-12-27 23:13 被阅读533次

    ES6加强了对Unicode的支持,并且扩展了字符串对象。

    字符的Unicode表示法

    JavaScript允许采用 \uxxxx 形式表示一个字符,其中“xxxx”表示字符的码点。
    但是,这种表示法只限于 \u0000 —— \uFFFF 之间的字符。超出这个范围的字符,必须用两个双字节的形式表达。

    "\uD842\uDFB7"
    // " "
    

    有了这种表示法之后,JavaScript共有6种方法可以表示一个字符。

    '\z' === 'z' // true
     '\172' === 'z' // true 
    '\x7A' === 'z' // true 
    '\u007A' === 'z' // true 
    '\u{7A}' === 'z' // true
    

    codePointAt()

    JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode码点大于 0xFFFF的字符),JavaScript会认为它们是两个字符。

    var s = " ";
    s.length // 2 
    s.charAt(0) // '' 
    s.charAt(1) // ''
    s.charCodeAt(0) // 55362 
    s.charCodeAt(1) // 57271
    

    codePointAt 方法返回的是码点的十进制值,如果想要十六进制的值,可以使用 toString 方法转换一下。
    codePointAt方法是测试一个字符由两个字节还是由四个字节组成的最简单方法。

    String.fromCodePoint()

    ES5提供 方法,用于从码点返回对应字符,但是这个方法不能识别32位的UTF-16字符(Unicode编号大 于 )。
    String.fromCharCode
    注意, fromCodePoint 方法定义在 String 对象上,而 codePointAt 方法定义在字符串的实例对象上。

    字符串的遍历器接口

    ES6为字符串添加了遍历器接口(详见《Iterator》一章),使得字符串可以被 for...of 循环遍历。

    at()

    ES5对字符串对象提供 charAt 方法,返回字符串给定位置的字符。该方法不能识别码点大于 0xFFFF 的字符。

    'abc'.charAt(0) // "a" 
    '吉 '.charAt(0) // "\uD842"
    

    上面代码中, charAt 方法返回的是UTF-16编码的第一个字节,实际上是无法显示的。 目前,有一个提案,提出字符串实例的 at 方法,可以识别Unicode编号大于 0xFFFF 的字符,返回正确的字符。

    'abc'.at(0) // "a" 
    ' 吉'.at(0) // " "
    

    这个方法可以通过垫片库实现。

    normalize()

    为了表示语调和重音符号,Unicode提供了两种方法。一种是直接提供带重音符号的字符,比如 (\u01D1)。另一种是提供 合成符号(combiningcharacter),即原字符与重音符号的合成,两个字符合成一个字符,比如 (\u004F)和 ˇ (\u030C) 合成 Ǒ (\u004F\u030C)。
    这两种表示方法,在视觉和语义上都等价,但是JavaScript不能识别。
    ES6提供字符串实例的 normalize() 方法,用来将字符的不同表示方法统一为同样的形式,这称为Unicode正规化。

    includes(), startsWith(), endsWith()

    传统上,JavaScript只有 indexOf 方法,可以用来确定一个字符串是否包含在另一个字符串中。ES6又提供了三种新方法。
    includes():返回布尔值,表示是否找到了参数字符串。 startsWith():返回布尔值,表示参数字符串是否在源字符串的头部。 endsWith():返回布尔值,表示参数字符串是否在源字符串的尾部。

    repeat()

    repeat 方法返回一个新字符串,表示将原字符串重复 n 次。

    padStart(),padEnd()

    ES7推出了字符串补全长度的功能。如果某个字符串不够指定长度,会在头部或尾部补全。 padStart 用于头部补 全, padEnd 用于尾部补全。

    'x'.padStart(5, 'ab') // 'ababx' 'x'.padStart(4, 'ab') // 'abax'
    'x'.padEnd(5, 'ab') // 'xabab' 'x'.padEnd(4, 'ab') // 'xaba'
    

    如果原字符串的长度,等于或大于指定的最小长度,则返回原字符串。
    如果省略第二个参数,则会用空格补全长度。
    另一个用途是提示字符串格式。

    '12'.padStart(10, 'YYYY-MM-DD') // "YYYY-MM-12" '09-12'.padStart(10, 'YYYY-MM-DD') // "YYYY-09-12"
    

    模板字符串

    模板字符串(template string)是增强版的字符串,用反引号(`)标识。它可以当作普通字符串使用,也可以用来定义多行字符 串,或者在字符串中嵌入变量。

    // 普通字符串
    `In JavaScript '\n' is a line-feed.`
    // 多行字符串
    `In JavaScript this is
    not legal.` console.log(`string text line 1
    string text line 2`);
    // 字符串中嵌入变量
    var name = "Bob", time = "today"; `Hello ${name}, how are you ${time}?`
    

    上面代码中的字符串,都是用反引号表示。如果在模板字符串中需要使用反引号,则前面要用反斜杠转义。

    由于模板字符串的大括号内部,就是执行JavaScript代码,因此如果大括号内部是一个字符串,将会原样输出。

    实例:模板编译(难)

    标签模板

    模板字符串的功能,不仅仅是上面这些。它可以紧跟在一个函数名后面,该函数将被调用来处理这个模板字符串。这被称为“标 签模板”功能(tagged template)。

    String.raw()

    String.raw 方法,往往用来充当模板字符串的处理函数,返回一个斜杠都被转义(即斜杠前面再加一个斜杠)的字符串,对 应于替换变量后的模板字符串。

    String.raw({ raw: 'test' }, 0, 1, 2); // 't0e1s2t'
    // 等同于
    String.raw({ raw: ['t','e','s','t'] }, 0, 1, 2);
    

    相关文章

      网友评论

        本文标题:react native: js语法 字符串的扩展

        本文链接:https://www.haomeiwen.com/subject/fwlugxtx.html