美文网首页
Python 源码剖析-INT对象(中)

Python 源码剖析-INT对象(中)

作者: 敬贤icode121 | 来源:发表于2019-02-02 17:19 被阅读0次

    INT函数与对象剖析(中)

    引言

    在上一篇中可以得知int()函数走了一遍Python底层的 intobject 对象, 并且熟悉了 int(base='',x='')形式的函数声明,现在我们将继续探究int函数int_new 初始化的过程

    对象的创建

    • python创建对象主要有两种方法,Python C API和PyInt_Type。
    • Python C API让用户从C环境与Python交互,一共有两种API,一种是AOL(Abstract Object Layer)即泛型API,另一种是COL(Concrete Object Layer)即类型API;AOL都有PyObject_*的形式,可以应用到任何Python对象上,表达式一般表示为:PyObject intObj = PyObject_new(PyObject,&PyInt_Type),而COL的API一般如下:PyObject intObj = PyInt_FromLong(1000);我们就创建了一个1000整数对象。
    • 无论采用哪种Python C API,Python都是最终直接分配内存,因为这都是Python的内建对象

    int的初始化在底层有三种实现方法

      • PyInt_FromString(string, NULL, base);
      • PyInt_FromUnicode(PyUnicode_AS_UNICODE(x),PyUnicode_GET_SIZE(x), base);
      • PyInt_FromLong(x);
        其中PyInt_FromString,PyInt_FromUnicode最终都是调用了PyInt_FromLong来生成整数对象。
        本章我们将一一分析源码的实现,了解INT对象的创建过程。

    • PyInt_FromString
      顾名思义,表示从一个字符串生成一个int对象
    PyObject *
    PyInt_FromString(char *s, char **pend, int base)
    {
        if ((base != 0 && base < 2) || base > 36) {
            PyErr_SetString(PyExc_ValueError,
                            "int() base must be >= 2 and <= 36");
            return NULL;
        }
        if (base == 0 && s[0] == '0') { 
            //【1】如果字符串int(base=''?,x='012')以0开头
            x = (long) PyOS_strtoul(s, &end, base);
            if (x < 0)
                return PyLong_FromString(s, pend, base);
        }
        else
            //【2】如果字符串不为0开头,将判断是否有'+','-'标识等
            x = PyOS_strtol(s, &end, base);
        if (end == s || !isalnum(Py_CHARMASK(end[-1])))
            goto bad;
        
      bad:
            PyErr_Format(PyExc_ValueError,"invalid literal for int() with base %d:%s",base,PyString_AS_STRING(srepr));
            return NULL;
        return PyInt_FromLong(x);
    

    我们来看看【1】本分进入的分支 PyOs_stroul, 其实仔细想想这里肯定是判断是 0b,0o,0x 的进制数,比如x = '0x15'。这里跟进源码其实就是 switch-case 分别对base进行 进制位的判断,比如当base=8时代码如下:

        case 8:     /* skip leading 0o or 0O */
            if (*str == '0') {
                ++str;
                if (*str == 'o' || *str == 'O') {
                    /* there must be at least one digit after 0o */
                    if (_PyLong_DigitValue[Py_CHARMASK(str[1])] >= 8) {
                        //八进制数最大不能超过8
                        if (ptr)
                            *ptr = str;
                        return 0;
                    }
                    ++str;
                }
            }
            break;
    

    最终,这里的x传入了PyInt_FromLong。

    跟进最后的 PyInt_FromLong

    PyObject *
    PyInt_FromLong(long ival)
    {
        register PyIntObject *v;
    #if NSMALLNEGINTS + NSMALLPOSINTS > 0
        if (-NSMALLNEGINTS <= ival && ival < NSMALLPOSINTS) {
            //[1] 小整数池数组,在Python虚拟机初始化的时候会想JAVA中的static{ } 代码块预先定义好了小整数对象, 如果取的值在该数组中则直接返回,避免了堆的malloc以及free,这样大大提升了虚拟机的执行效率。在Python2.7.14中 ,这个List的范围为[-5:257],也就是说,调用int(x),-5<x<257将不会产生 malloc操作。否则进入【2】
            v = small_ints[ival + NSMALLNEGINTS];
            Py_INCREF(v);
            return (PyObject *) v;
        }
    #endif
        if (free_list == NULL) {
            //[2] 非小整数对象池内存的申请
            if ((free_list = fill_free_list()) == NULL)
                return NULL;
        }
        //[3] Undefined 在章节(下)中说明解释
        v = free_list;
        free_list = (PyIntObject *)Py_TYPE(v);
        (void)PyObject_INIT(v, &PyInt_Type);
        v->ob_ival = ival;
        return (PyObject *) v;
    }
    

    通用整数对象池的分配

    static PyIntObject *
    fill_free_list(void)
    {
        PyIntObject *p, *q;
        /* Python's object allocator isn't appropriate for large blocks. */
        p = (PyIntObject *) PyMem_MALLOC(sizeof(PyIntBlock));
        if (p == NULL)
            //如果不能申请成功,代表内存不足,抛出内存异常
            return (PyIntObject *) PyErr_NoMemory();
        ((PyIntBlock *)p)->next = block_list;
        block_list = (PyIntBlock *)p;
        //将所有的int内存块首尾链接在一起,并返回最后一个内存块的地址
        p = &((PyIntBlock *)p)->objects[0];
        q = p + 124;
        while (--q > p)
            Py_TYPE(q) = (struct _typeobject *)(q-1);
        Py_TYPE(q) = NULL;
        return p + 124 - 1;
    }
    
    ------------
    ------------
    static PyIntBlock *block_list = NULL;
    static PyIntObject *free_list = NULL;
    
    ------------
    
    struct PyIntBlock {
        struct PyIntBlock *next;
        PyIntObject objects[124];//一个内存快存124个整数值
    };
    

    至此,我们可以清晰的看到整数对象在内存中(这里可以称为Python虚拟机所维护的内存)的分布,创建,使用的状态了。

    总结

    本篇可以学习到:

    • Python小整数对象池机制。
    • 通用小整数对象在内存空间的维护。
    • python int 对象是由PyInt_FromLong直接生成的。
    • 如下图所示的一些测试


      image

    鸣谢作者,感谢阅读

    ©敬贤。

    热爱知识,分享知识
    2018-06-14 23:29:36 星期四

    相关文章

      网友评论

          本文标题:Python 源码剖析-INT对象(中)

          本文链接:https://www.haomeiwen.com/subject/vlossqtx.html