美文网首页
python基础1

python基础1

作者: 只喝白开水a | 来源:发表于2018-09-11 10:07 被阅读0次

    一·Python是如何进行内存管理
    Python是动态类型的语言,对象与引用分离,在Python中,整数和短小的字符,Python都会缓存这些对象,以便重复使用。当我们创建多个等于1的引用时,实际上是让所有这些引用指向同一个对象。链接

    关键字:引用计数,垃圾回收,标记清除,内存池分配机制
    引用:

    >>> a= 10
    >>> b=10
    >>> print id(a),id(b),id(10)
    10414060 10414060 10414060
    >>>
    >>> import sys
    >>> print sys.getrefcount(a),sys.getrefcount(b),sys.getrefcount(10)
    160 160 160
    >>> c = b
    >>> print sys.getrefcount(c)
    159
    >>> print sys.getrefcount(a)
    159
    >>> d= c
    >>> print sys.getrefcount(d)
    160
    

    引用环:
    两个对象可能相互引用,从而构成所谓的引用环
    即使是一个对象,只需要自己引用自己,也能构成引用环

    >>> g = [ ]
    >>> g.append(g)
    >>> print sys.getrefcount(g)
    3
    

    引用减少:通过del 来减少引用 ......

    垃圾回收:引用计数为0.
    分代回收:存活时间越久的对象,越不可能在后面的程序中变成垃圾,所以减少在垃圾回收中扫描它们的频率。
    孤立的引用环:标记-清除
    内存池机制:多层封装管理,大内存malloc,小内存pymalloc,python对象(list,整数,浮点数)都有其独立的内存池.
    内存池:

    1. Python 的内存机制呈现金字塔形状,-1,-2 层主要有操作系统进行操作;
    2. 第 0 层是 C 中的 malloc,free 等内存分配和释放函数进行操作;
    3. 第 1 层和第 2 层是内存池,有 Python 的接口函数 PyMem_Malloc 函数实现,当对象小于256K 时有该层直接分配内存;
    4. 第 3 层是最上层,也就是我们对 Python 对象的直接操作;
      Python 在运行期间会大量地执行 malloc 和 free 的操作,频繁地在用户态和核心态之间进行切换,这将严重影响 Python 的执行效率。为了加速 Python 的执行效率,Python 引入了一个内存池机制,用于管理对小块内存的申请和释放。Python 内部默认的小块内存与大块内存的分界点定在 256 个字节,当申请的内存小于 256 字节时,PyObject_Malloc 会在内存池中申请内存;当申请的内存大于 256 字节时,PyObject_Malloc 的行为将蜕化为 malloc 的行为。当然,通过修改 Python 源代码,我们可以改变这个默认值,从而改变 Python 的默认内存管理行为。
      调优手段(了解)
      1.手动垃圾回收
      2.调高垃圾回收阈值
      3.避免循环引用(手动解循环引用和使用弱引用)

    二·Python 引用/赋值,浅拷贝,深拷贝

    赋值/引用:创建了对象的一个新的引用,修改其中任意一个变量都会影响到另一个。
    浅拷贝:创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法:a=b[::];2,工厂函数,如list();3,copy模块的copy()函数}
    深拷贝:创建一个新的对象,并且递归的复制它所包含的对象(修改其中一个,另外一个不会改变){copy模块的deep.deepcopy()函数}
    拷贝操作的警告 :
    1、对于非容器类型,如数字,字符,以及其它“原子”类型,没有拷贝一说。产生的都是原对象的引用。
    2、如果元组变量值包含原子类型对象,即使采用了深拷贝,也只能得到浅拷贝

    三·Python 单引号,双引号,三引号的区别

    单引号和双引号是等效的,如果要换行,需要符号(),三引号则可以直接换行,并且可以包含注释。

    单引号:s4 = ‘Let\’s go’
    双引号:s5 = “Let’s go”
    s6 = ‘I realy like“python”!’
    

    四·Python 去重,排序,re模块,lambda,tuple和list的转换

    去重:set()
    排序:sorted(),list.sort()
    re match与search区别
    lambda:匿名函数,需要一个函数,但是又不想费神去命名一个函数,a=lambdax,y:x+y
    转换:tuple(),list()

    四·Python try ... except
    try下的语句正常执行,则执行else块代码。如果发生异常,就不会执行。
    在except中return后还会执行finally中的代码,如果存在finally语句,最后总是会执行。用 raise 方法可以抛出自定义异常。
    except: #捕获所有异常
    except: <异常名>: #捕获指定异常
    except:<异常名 1, 异常名 2> : 捕获异常 1 或者异常 2
    except:<异常名>,<数据>:捕获指定异常及其附加的数据
    except:<异常名 1,异常名 2>:<数据>:捕获异常名 1 或者异常名 2,及附加的数据

    五·贪婪匹配与非贪婪匹配
    String str="abcaxc";
    贪婪匹配:最大长度匹配,例如去匹配str:abcaxc(ab*c)。

    非贪婪匹配:就是匹配到结果就好,就少的匹配字符。例如:abc(ab*c)。

    六·Python的可变与不可变数据类型

    可变数据类型:列表list和字典dict;不可变数据类型:整型int、浮点型float、字符串型string和元组tuple。

    不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象;
    可变数据类型,允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。
    操作不可变对象:

    >>> a =(2,3)
    >>> print a[1]
    3
    >>> a[1] =3
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    TypeError: 'tuple' object does not support item assignment
    

    七·print 调用 Python 中底层的什么方法

    print 方法默认调用 sys.stdout.write 方法,即往控制台打印字符串。

    八· input()函数
    在 Python3 中,input()获取用户输入,不论用户输入的是什么,获取到的都是字符串类型的。
    在 Python2 中有 raw_input()和 input():
    raw_input()和 Python3 中的 input()作用是一样的,
    input()输入的是什么数据类型的,获取到的就是什么数据类型的。
    九· range 和 xrange 的区别
    两者用法相同,不同的是 range 返回的结果是一个列表,而 xrange 的结果是一个生成器,前者是直接开辟一块内存空间来保存列表,后者是边循环边使用,只有使用时才会开辟内存空间,所以当列表很长时,使用 xrange 性能要比 range 好。

    十· read、readline 和 readlines 的区别
    read:读取整个文件。
    readline:读取下一行,使用生成器方法。
    readlines:读取整个文件到一个迭代器以供我们遍历。

    十一·initnew的区别
    init 通常用于初始化一个新实例,控制这个初始化的过程,比如添加一些属性, 做一些额外的操作,发生在类实例被创建完以后。它是实例级别的方法。
    new 通常用于控制生成一个新实例的过程。它是类级别的方法。
    相关链接

    十二·模块和包
    在 Python 中,模块是搭建程序的一种方式。每一个 Python 代码文件都是一个模块,并可以引用
    其他的模块,比如对象和属性。
    一个包含许多 Python 代码的文件夹是一个包。一个包可以包含模块和子文件夹。

    十三·Python 特性
    Python 是强类型的动态脚本语言:
    强类型:不允许不同类型相加。
    动态:不使用显示数据类型声明,且确定一个变量的类型是在第一次给它赋值的时候。
    脚本语言:一般也是解释型语言,运行代码只需要一个解释器,不需要编译。
    类型转换:int(‘str’,base=’n’)

    >>> int('0x004f',base=16)
    79
    

    解释性语言和编译性语言:
    解释性语言在运行程序的时候才会进行翻译。
    编译型语言写的程序在执行之前,需要一个专门的编译过程,把程序编译成机器语言(可执行文件)

    十四·Python 程序运行提升性能
    1、使用多进程,充分利用机器的多核性能
    2、对于性能影响较大的部分代码,可以使用 C 或 C++编写
    3、对于 IO 阻塞造成的性能影响,可以使用 IO 多路复用来解决(同一个线程内同时处理多个IO请求的目的
    4、尽量使用 Python 的内建函数
    5、尽量使用局部变量

    十五·Python 自省
    自带说明的名字叫自省。(反射是 java 的说法,Python叫自省)
    自省简单的说,就是用 python 的代码自己告诉这个对象是什么,有什么,以及祖宗是什么,子孙是什么....
    python 提供的自省机制:help,dir 。其他的可以用 这两个找到
    十六·Python 代码规范(PEP8规范)

    1. 变量

    常量:大写加下划线 USER_CONSTANT

    私有变量 : 小写和一个前导下划线 _private_value(Python 中不存在私有变量,这只是程序员之间的一个约定,用于警告说明这是一个私有变量,外部类不要去访问它。但实际上,外部类还是可以访问到这个变量)

    内置变量 : 小写,两个前导下划线和两个后置下划线 class(前导下划线会导致变量在解释期间被更名。这是为了避免内置变量和其他变量产生冲突。用户定义的变量要严格避免这种风格)

    1. 函数和方法

    总体:小写和下划线。

    私有方法 :小写和一个前导下划线

    特殊方法 :小写和两个前导下划线,两个后置下划线
    这种风格只应用于特殊函数,比如操作符重载等。

    函数参数 : 小写和下划线,缺省值等号两边无空格


    1. 类总是使用驼峰格式命名,所有单词首字母大写其余字母小写。类名应该简明,精确,并足以从中理解类所完成的工作。常见的一个方法是使用表示其类型或者特性的后缀

    2. 模块和包
      除特殊模块 init 之外,模块名称都使用不带下划线的小写字母。

    3. 参数
      不要用断言来实现静态类型检测。
      不要滥用 *args 和 **kwargs。

    4. 其他
      1.使用 has 或 is 前缀命名布尔元素
      is_connect = True
      2.验证脚本
      可以安装一个 pep8 脚本用于验证你的代码风格是否符合 PEP8


    1-5:原文链接

    6-15:《黑马程序员》

    相关文章

      网友评论

          本文标题:python基础1

          本文链接:https://www.haomeiwen.com/subject/qqrcgftx.html