美文网首页
处理四字节字符串

处理四字节字符串

作者: 轮回_1174 | 来源:发表于2017-03-27 15:40 被阅读0次

字符的Unicode表示法

JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode码点大于0xFFFF的字符),必须用两个双字节的形式表示。

'\uD842\uDFB7'//𠮷

ES6可以在一个括号内直接用大于0xFFFF表示

'\u{20bb7}'//𠮷

对于Unicode码点大于0xFFFF的字符

一个字符的length长度是2

'𠮷'//'\uD842\uDFB7'
'𠮷'.length//2
'𠮷'[0]//'\uD842'
'𠮷'[1]//'\uDFB7'

返回字符码点

'𠮷'.codePointAt(0).toString(16)//"20bb7"
//遗憾的是
'𠮷'.codePointAt(1).toString(16)//'DFB7'

如字符串中包含Unicode码点大于0xFFFF的字符,使用String.prototype[Symbol.iterator]可以正确返回每个字符

for(let i of '𠮷a'){
console.log(i);
}
//𠮷 
//a
[... '𠮷a']//['𠮷','a']
//失败
var s='𠮷a';
for(let i=0;i<=s.length;i++){
console.log(s[i])
}
//�
//�
//a

相关文章

  • node.js学习笔记之buffer模块

    JavaScript对字符串处理十分友好,无论是宽字节还是单字节字符串,都被认为是一个字符串。Node中需要处理网...

  • 6.PHP字符串

    字符串的处理介绍 字符串的处理方式 在C语言中字符串是作为字节数组处理的。在Java语言中字符串是作为对象处理的。...

  • js通过字节长度截取中英文混合字符串

    /** *截取字符串中英文混合 *@paramstr待处理字符串 *@paramlen截取字节长度中文2字节英文1...

  • 2018-07-08

    Python没有专门处理字节的数据类型。但由于str既是字符串,又可以表示字节,所以,字节数组=str。而在C语言...

  • 处理四字节字符串

    字符的Unicode表示法 JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那...

  • Go 字符串常用的系统函数

    Go 字符串常用的系统函数 统计字符串的长度,按字节len(str) 字符串遍历,同时处理有中文的问题 r:[]r...

  • Python的编码问题总结

    字节字符串和字符字符串字节字符串s是在console上看着是中文,但是正在输出的确是字节字符串,而不是字符字符串。...

  • 扩展方法

    1.字符串的扩展 codePointAt() 能正确处理四个字节存储的字符,返回一个字符的码点 fromCodeP...

  • Go笔记-Chap5 数据

    5.1 字符串 不可变字节序列,本身是个复合结构 默认值是“”,空串 使用“ ' ”定义不做转义处理的原始字符串 ...

  • IOS计算字符串字节长度

    计算字符串字节长度:方法一 计算字符串字节长度:方法二

网友评论

      本文标题:处理四字节字符串

      本文链接:https://www.haomeiwen.com/subject/ccrrottx.html