20190726 ES6第五章字符串的新增方法

作者: 瑶九九 | 来源:发表于2019-07-16 01:44 被阅读0次

String.fromCodePoint()

ES5中提供了String.fromCharCode()方法，用于从Unicode码点返回对应字符，但是这个方法不能识别码点大于xFFFF的字符

String.fromCharCode(0x20BB7)
// "ஷ"
// 该方法不能识别码点大于0xFFFF的字符，因此0x20BB7就发生了溢出，最高位2被舍弃，变成0x0BB7，返回的也是码点U+0BB7对应的字符

为了识别大于0xFFFF的字符，弥补String.fromCharCode()方法的不足，ES6提供了String.fromCodePoint()方法
若String.fromCodePoint()方法中含有多个参数，则这些参数会被合并成一个字符串返回

String.fromCodePoint(0x20BB7)
// "𠮷"
String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x\uD83D\uDE80y'
// true

注意，fromCodePoint方法定义在String对象上，而codePointAt方法定义在字符串的实例对象上

String.raw()

ES6为原生的String对象提供了一个raw()方法
该方法返回一个将斜杠都被转义的字符串，往往用于模板字符串的处理方法，它会将所有变量替换，而且对斜杠进行转义

String.raw`Hi\n${2+3}!`;
// 返回 "Hi\\n5!"

String.raw`Hi\u000A!`;
// 返回 "Hi\\u000A!"

如果原字符串的斜杆已经转义，那么String.raw()会进行再次转义

codePointAt()

JavaScript 内部，字符以 UTF-16 的格式储存，每个字符固定为2个字节。对于那些需要4个字节储存的字符（Unicode 码点大于0xFFFF的字符），JavaScript 会认为它们是两个字符

var s = "𠮷";

s.length // 2
s.charAt(0) // ''
s.charAt(1) // ''
s.charCodeAt(0) // 55362
s.charCodeAt(1) // 57271
// charAt()方法无法读取整个字符
// charCodeAt()方法只能分别返回前两个字节和后两个字节的值

汉字“𠮷”（注意，这个字不是“吉祥”的“吉”）的码点是0x20BB7，UTF-16 编码为0xD842 0xDFB7（十进制为55362 57271），需要4个字节储存。对于这种4个字节的字符，JavaScript 不能正确处理，字符串长度会误判为2

ES6提供了codePointAt()方法，能够正确处理4个字节储存的字符，返回一个字符的码点

let s = '𠮷a';

s.codePointAt(0) // 134071
s.codePointAt(1) // 57271

s.codePointAt(2) // 97

codePointAt()方法的参数，是字符在字符串中的位置（从 0 开始）。上面代码中，JavaScript 将“𠮷a”视为三个字符，codePointAt 方法在第一个字符上，正确地识别了“𠮷”，返回了它的十进制码点 134071（即十六进制的20BB7）。在第二个字符（即“𠮷”的后两个字节）和第三个字符“a”上，codePointAt()方法的结果与charCodeAt()方法相同。

codePointAt()方法返回的是码点的十进制值，如果想要十六进制的值，可以使用toString()方法转换一下。

let s = '𠮷a';

s.codePointAt(0).toString(16) // "20bb7"
s.codePointAt(2).toString(16) // "61"

在此时，codePointAt()方法的参数仍然是不正确的。比如，上面代码中，字符a在字符串s的正确位置序号应该是 1，但是必须向codePointAt()方法传入 2。
解决这个问题的方法：

for...of循环

let s = '𠮷a';
for (let ch of s) {
  console.log(ch.codePointAt(0).toString(16));
}
// 20bb7
// 61

使用扩展运算符(...)进行展开运算

let arr = [...'𠮷a']; // arr.length === 2
arr.forEach(
  ch => console.log(ch.codePointAt(0).toString(16))
);
// 20bb7
// 61

normalize()

为了表示语调符号和重音符号，Unicode提供了两种方法：一种是直接提供带重音符号的字符，比如Ǒ（\u01D1）。另一种是提供合成符号（combining character），即原字符与重音符号的合成，两个字符合成一个字符，比如O（\u004F）和ˇ（\u030C）合成Ǒ（\u004F\u030C）
这两种表示方法，在视觉和语义上都等价，但是 JavaScript 不能识别

'\u01D1'==='\u004F\u030C' //false

'\u01D1'.length // 1
'\u004F\u030C'.length // 2

ES6 提供字符串实例的normalize()方法，用来将字符的不同表示方法统一为同样的形式，这称为 Unicode 正规化

'\u01D1'.normalize() === '\u004F\u030C'.normalize()
// true

includes(), startsWith(), endsWith()

传统上，JavaScript 只有indexOf方法，可以用来确定一个字符串是否包含在另一个字符串中。ES6 又提供了三种新方法：

includes()：返回布尔值，表示是否找到了参数字符串
startsWith()：返回布尔值，表示参数字符串是否在原字符串的头部
endsWith()：返回布尔值，表示参数字符串是否在原字符串的尾部
这三个方法都支持第二个参数，表示开始搜索的位置
但是针对endsWith()方法，第二个参数表示的是针对前n个字符，而其他方法表示的是针对从第n个位置直到字符串结束

let s = 'Hello world!';

s.startsWith('Hello') // true
s.endsWith('!') // true
s.includes('o') // true

s.startsWith('world', 6) // true
s.endsWith('Hello', 5) // true
s.includes('Hello', 6) // false

repreat()

repeat方法返回一个新字符串，表示将原字符串重复n次；
参数如果是小数，会被取整；
参数是负数或者Infinity则爆错；
参数NaN等同于0；
参数是字符串，则会先转换成数字。

'x'.repeat(3) // "xxx"
'na'.repeat(2.9) // "nana" 取整变成2

'na'.repeat(Infinity)
// RangeError
'na'.repeat(-1)
// RangeError

'na'.repeat(NaN) // "" NaN等同于0

'na'.repeat('na') // "" 
'na'.repeat('3') // "nanana" 字符3转换成数字3

padStart()，padEnd()

ES2017 引入了字符串补全长度的功能。如果某个字符串不够指定长度，会在头部或尾部补全。padStart()用于头部补全，padEnd()用于尾部补全
padStart()和padEnd()一共接受两个参数，第一个参数是字符串补全生效的最大长度，第二个参数是用来补全的字符串;

'x'.padStart(5, 'ab') // 'ababx'
'x'.padStart(4, 'ab') // 'abax'

'x'.padEnd(5, 'ab') // 'xabab'
'x'.padEnd(4, 'ab') // 'xaba'

注意：

如果原字符串的长度，等于或大于最大长度，则字符串补全不生效，返回原字符串
如果用来补全的字符串与原字符串，两者的长度之和超过了最大长度，则会截去超出位数的补全字符串
如果省略第二个参数，默认使用空格补全长度

trimStart()，trimEnd()

trimStart()消除字符串头部的空格，trimEnd()消除尾部的空格。它们返回的都是新字符串，不会修改原始字符串

const s = '  abc  ';

s.trim() // "abc"
s.trimStart() // "abc  "
s.trimEnd() // "  abc"

注意：
除了空格键，这两个方法对字符串头部（或尾部）的 tab 键、换行符等不可见的空白符号也有效

网友评论

本文标题：20190726 ES6第五章字符串的新增方法

本文链接：https://www.haomeiwen.com/subject/fepakctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

20190726 ES6第五章字符串的新增方法

String.fromCodePoint()

String.raw()

codePointAt()

normalize()

includes(), startsWith(), endsWith()

repreat()

padStart()，padEnd()

trimStart()，trimEnd()

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

20190726 ES6第五章 字符串的新增方法

String.fromCodePoint()

String.raw()

codePointAt()

normalize()

includes(), startsWith(), endsWith()

repreat()

padStart()，padEnd()

trimStart()，trimEnd()

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

20190726 ES6第五章字符串的新增方法