美文网首页我是程序员Pythoner集中营Python精选
4. Python3源码—字符串(bytes)对象

4. Python3源码—字符串(bytes)对象

作者: 阿里云云栖号 | 来源:发表于2018-06-08 13:05 被阅读137次

    4.1. 字符串对象

    字符串对象是“变长对象”。

    4.1.1. Python中的创建

    Python中字符串(bytes)对象创建最重要的方法为PyBytes_FromStringAndSize,如下Python语句最终会调用到PyBytes_FromStringAndSize:

    4.1.2. PyBytes_FromStringAndSize的C调用栈

    词法解析,最终调到PyBytes_FromStringAndSize,调用顺序如下:

    4.1.3. PyBytes_FromStringAndSize源码

    可以看到:

    1、字符串对象的C数据结构:

    2、空串缓存:空串(nullstring)为同一个地址,第二次需要空串时,只是将计数加1,在_PyBytes_FromSize中实现空串缓存;

    3、字符缓冲池:字符(characters)为同一个地址,第二次需要该字符时,只是将计数加1,在PyBytes_FromStringAndSize中实现字符缓存;

    4.2. 字符串对象的特性

    支持tp_as_number、tp_as_sequence、tp_as_mapping这三种操作。

    4.2.1. 数值操作

    4.2.2. 序列操作

    因为没有实现PySequenceMethods中的设置方法,所以字符串不可变。

    其中:

    1、bytes_length

    2、bytes_concat

    多个字符串相加效率低于join,join只分配一次内存;

    1、bytes_repeat

    效率要高于同个字符串相加;

    2、bytes_item:暂时没有找到相应Python语句;

    3、bytes_contains

    4.2.3. 关联操作

    其中:

    bytes_subscript

    test[1]会走bytes_subscript方法的index分支,test[0:5]会走slice分支;

    4.2.4. to string

    4.2.5. hash

    4.2.6. 比较

    4.2.7. 内置方法

    4.3 参考

    Python源码剖析

    本文作者:whj0709

    阅读原文

    本文为云栖社区原创内容,未经允许不得转载。

    相关文章

      网友评论

        本文标题:4. Python3源码—字符串(bytes)对象

        本文链接:https://www.haomeiwen.com/subject/kptasftx.html