美文网首页Python
Python3中的字符串

Python3中的字符串

作者: CurryCoder | 来源:发表于2019-08-18 20:17 被阅读0次

    技术交流QQ群:1027579432,欢迎你的加入!

    1.字符串介绍

    • 字符串是不可变的序列数据类型,不能直接修改字符串本身,和数字类型一样!Python3全面支持Unicode编码,所有的字符串都是Unicode字符串,所以传统Python2存在的编码问题不再困扰我们,可以放心大胆的使用中文。
    • 在Python3以后,字符串和bytes类型彻底分开了。字符串是以字符为单位进行处理的,bytes类型是以字节为单位处理的。

    2.字符串的运算

    字符串的运算.png

    3.字符串的内置方法

    字符串的内置方法1.png
    字符串的内置方法2.png
    字符串的内置方法3.png
    字符串的内置方法4.png
    字符串的内置方法5.png

    4.字符编码

    • 字符编码:计算机只能处理数字01,如果要处理文本,就必须先把文本转换为数字01,这种转换方式就称为字符编码。
    • 几种常见编码:
      • ASCII编码:早期专门为英语语系编码,只有255个字符,每个字符需要8位也就是1个字节,不兼容汉字
      • Unicode编码:又称万国码,国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。用2个字节来表示汉字。
      • UTF-8编码:为了节省字节数,在Unicode的基础上进行优化的编码。用1个字节表示英文字符,3个字符表示汉字。天生兼容ASCII编码,所以最为流行。
      • GB2312:我国早期自己制定的中文编码,世界范围内不通用。
      • GBK: 全称《汉字内码扩展规范》,向下与GB2312兼容,向上支持ISO10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。windows中文版的汉字编码用的就是GBK。也非世界范围通用的编码;
      • 其它编码:非以上类型者的统称。属于能不用就不要碰的编码。
    • 最后再强调一次,Python3在运行时全部使用Unicode编码!
    • 几条规则:
      • a.操作系统运行时,在内存中,统一使用的都是Unicode编码,当需要将数据保存到硬盘或者网络传输的时候,就转换为UTF-8编码,进行保存和传输。
      • b.用文本编辑器的时候,从文件系统或者说硬盘上读取的UTF-8编码字符被转换为Unicode字符到内存里,供程序或者操作系统使用。编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。
      • c.浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8传输到客户的浏览器。

    5.博客原文

    相关文章

      网友评论

        本文标题:Python3中的字符串

        本文链接:https://www.haomeiwen.com/subject/uyjdsctx.html