技术交流QQ群:1027579432,欢迎你的加入!
1.字符串介绍
- 字符串是不可变的序列数据类型,不能直接修改字符串本身,和数字类型一样!Python3全面支持Unicode编码,所有的字符串都是Unicode字符串,所以传统Python2存在的编码问题不再困扰我们,可以放心大胆的使用中文。
- 在Python3以后,字符串和bytes类型彻底分开了。字符串是以字符为单位进行处理的,bytes类型是以字节为单位处理的。
2.字符串的运算
字符串的运算.png3.字符串的内置方法
字符串的内置方法1.png字符串的内置方法2.png
字符串的内置方法3.png
字符串的内置方法4.png
字符串的内置方法5.png
4.字符编码
- 字符编码:计算机只能处理数字01,如果要处理文本,就必须先把文本转换为数字01,这种转换方式就称为字符编码。
- 几种常见编码:
- ASCII编码:早期专门为英语语系编码,只有255个字符,每个字符需要8位也就是1个字节,不兼容汉字
- Unicode编码:又称万国码,国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。用2个字节来表示汉字。
- UTF-8编码:为了节省字节数,在Unicode的基础上进行优化的编码。用1个字节表示英文字符,3个字符表示汉字。天生兼容ASCII编码,所以最为流行。
- GB2312:我国早期自己制定的中文编码,世界范围内不通用。
- GBK: 全称《汉字内码扩展规范》,向下与GB2312兼容,向上支持ISO10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。windows中文版的汉字编码用的就是GBK。也非世界范围通用的编码;
- 其它编码:非以上类型者的统称。属于能不用就不要碰的编码。
- 最后再强调一次,Python3在运行时全部使用Unicode编码!
- 几条规则:
- a.操作系统运行时,在内存中,统一使用的都是Unicode编码,当需要将数据保存到硬盘或者网络传输的时候,就转换为UTF-8编码,进行保存和传输。
- b.用文本编辑器的时候,从文件系统或者说硬盘上读取的UTF-8编码字符被转换为Unicode字符到内存里,供程序或者操作系统使用。编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。
- c.浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8传输到客户的浏览器。
网友评论