python基础1

作者: 只喝白开水a | 来源:发表于2018-09-11 10:07 被阅读0次

一·Python是如何进行内存管理
Python是动态类型的语言，对象与引用分离，在Python中，整数和短小的字符，Python都会缓存这些对象，以便重复使用。当我们创建多个等于1的引用时，实际上是让所有这些引用指向同一个对象。链接

关键字：引用计数，垃圾回收，标记清除，内存池分配机制
引用：

>>> a= 10
>>> b=10
>>> print id(a),id(b),id(10)
10414060 10414060 10414060
>>>
>>> import sys
>>> print sys.getrefcount(a),sys.getrefcount(b),sys.getrefcount(10)
160 160 160
>>> c = b
>>> print sys.getrefcount(c)
159
>>> print sys.getrefcount(a)
159
>>> d= c
>>> print sys.getrefcount(d)
160

引用环：
两个对象可能相互引用，从而构成所谓的引用环
即使是一个对象，只需要自己引用自己，也能构成引用环

>>> g = [ ]
>>> g.append(g)
>>> print sys.getrefcount(g)
3

引用减少：通过del 来减少引用 ......

垃圾回收：引用计数为0.
分代回收：存活时间越久的对象，越不可能在后面的程序中变成垃圾，所以减少在垃圾回收中扫描它们的频率。
孤立的引用环：标记-清除
内存池机制：多层封装管理，大内存malloc，小内存pymalloc，python对象(list,整数,浮点数)都有其独立的内存池.
内存池：

Python 的内存机制呈现金字塔形状，-1，-2 层主要有操作系统进行操作；
第 0 层是 C 中的 malloc，free 等内存分配和释放函数进行操作；
第 1 层和第 2 层是内存池，有 Python 的接口函数 PyMem_Malloc 函数实现，当对象小于256K 时有该层直接分配内存；
第 3 层是最上层，也就是我们对 Python 对象的直接操作；
Python 在运行期间会大量地执行 malloc 和 free 的操作，频繁地在用户态和核心态之间进行切换，这将严重影响 Python 的执行效率。为了加速 Python 的执行效率，Python 引入了一个内存池机制，用于管理对小块内存的申请和释放。Python 内部默认的小块内存与大块内存的分界点定在 256 个字节，当申请的内存小于 256 字节时，PyObject_Malloc 会在内存池中申请内存；当申请的内存大于 256 字节时，PyObject_Malloc 的行为将蜕化为 malloc 的行为。当然，通过修改 Python 源代码，我们可以改变这个默认值，从而改变 Python 的默认内存管理行为。
调优手段（了解）
1.手动垃圾回收
2.调高垃圾回收阈值
3.避免循环引用（手动解循环引用和使用弱引用）

二·Python 引用/赋值，浅拷贝，深拷贝

赋值/引用：创建了对象的一个新的引用，修改其中任意一个变量都会影响到另一个。
浅拷贝：创建一个新的对象，但它包含的是对原始对象中包含项的引用（如果用引用的方式修改其中一个对象，另外一个也会修改改变）{1,完全切片方法：a=b[::]；2，工厂函数，如list()；3，copy模块的copy()函数}
深拷贝：创建一个新的对象，并且递归的复制它所包含的对象（修改其中一个，另外一个不会改变）{copy模块的deep.deepcopy()函数}
拷贝操作的警告：
1、对于非容器类型，如数字，字符，以及其它“原子”类型，没有拷贝一说。产生的都是原对象的引用。
2、如果元组变量值包含原子类型对象，即使采用了深拷贝，也只能得到浅拷贝

三·Python 单引号，双引号，三引号的区别

单引号和双引号是等效的，如果要换行，需要符号(),三引号则可以直接换行，并且可以包含注释。

单引号：s4 = ‘Let\’s go’
双引号：s5 = “Let’s go”
s6 = ‘I realy like“python”!’

四·Python 去重，排序，re模块，lambda，tuple和list的转换

去重：set()
排序：sorted(),list.sort()
re match与search区别
lambda:匿名函数，需要一个函数，但是又不想费神去命名一个函数，a=lambdax,y:x+y
转换：tuple(),list()

四·Python try ... except
try下的语句正常执行，则执行else块代码。如果发生异常，就不会执行。
在except中return后还会执行finally中的代码，如果存在finally语句，最后总是会执行。用 raise 方法可以抛出自定义异常。
except: #捕获所有异常
except: <异常名>: #捕获指定异常
except:<异常名 1, 异常名 2> : 捕获异常 1 或者异常 2
except:<异常名>,<数据>:捕获指定异常及其附加的数据
except:<异常名 1,异常名 2>:<数据>:捕获异常名 1 或者异常名 2,及附加的数据

五·贪婪匹配与非贪婪匹配
String str="abcaxc";
贪婪匹配：最大长度匹配，例如去匹配str：abcaxc(ab*c)。

非贪婪匹配：就是匹配到结果就好，就少的匹配字符。例如：abc(ab*c)。

六·Python的可变与不可变数据类型

可变数据类型：列表list和字典dict；不可变数据类型：整型int、浮点型float、字符串型string和元组tuple。

不可变数据类型，不允许变量的值发生变化，如果改变了变量的值，相当于是新建了一个对象，而对于相同的值的对象，在内存中则只有一个对象，内部会有一个引用计数来记录有多少个变量引用这个对象；
可变数据类型，允许变量的值发生变化，即如果对变量进行append、+=等这种操作后，只是改变了变量的值，而不会新建一个对象，变量引用的对象的地址也不会变化，不过对于相同的值的不同对象，在内存中则会存在不同的对象，即每个对象都有自己的地址，相当于内存中对于同值的对象保存了多份，这里不存在引用计数，是实实在在的对象。
操作不可变对象：

>>> a =(2,3)
>>> print a[1]
3
>>> a[1] =3
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment

七·print 调用 Python 中底层的什么方法

print 方法默认调用 sys.stdout.write 方法，即往控制台打印字符串。

八· input()函数
在 Python3 中，input()获取用户输入，不论用户输入的是什么，获取到的都是字符串类型的。
在 Python2 中有 raw_input()和 input()：
raw_input()和 Python3 中的 input()作用是一样的，
input()输入的是什么数据类型的，获取到的就是什么数据类型的。
九· range 和 xrange 的区别
两者用法相同，不同的是 range 返回的结果是一个列表，而 xrange 的结果是一个生成器，前者是直接开辟一块内存空间来保存列表，后者是边循环边使用，只有使用时才会开辟内存空间，所以当列表很长时，使用 xrange 性能要比 range 好。

十· read、readline 和 readlines 的区别
read:读取整个文件。
readline：读取下一行，使用生成器方法。
readlines：读取整个文件到一个迭代器以供我们遍历。

十一·init 和new的区别
init 通常用于初始化一个新实例，控制这个初始化的过程，比如添加一些属性，做一些额外的操作，发生在类实例被创建完以后。它是实例级别的方法。
new 通常用于控制生成一个新实例的过程。它是类级别的方法。
相关链接

十二·模块和包
在 Python 中，模块是搭建程序的一种方式。每一个 Python 代码文件都是一个模块，并可以引用
其他的模块，比如对象和属性。
一个包含许多 Python 代码的文件夹是一个包。一个包可以包含模块和子文件夹。

十三·Python 特性
Python 是强类型的动态脚本语言：
强类型：不允许不同类型相加。
动态：不使用显示数据类型声明，且确定一个变量的类型是在第一次给它赋值的时候。
脚本语言：一般也是解释型语言，运行代码只需要一个解释器，不需要编译。
类型转换：int(‘str’，base=’n’)

>>> int('0x004f',base=16)
79

解释性语言和编译性语言：
解释性语言在运行程序的时候才会进行翻译。
编译型语言写的程序在执行之前，需要一个专门的编译过程，把程序编译成机器语言（可执行文件）

十四·Python 程序运行提升性能
1、使用多进程，充分利用机器的多核性能
2、对于性能影响较大的部分代码，可以使用 C 或 C++编写
3、对于 IO 阻塞造成的性能影响，可以使用 IO 多路复用来解决（同一个线程内同时处理多个IO请求的目的）
4、尽量使用 Python 的内建函数
5、尽量使用局部变量

十五·Python 自省
自带说明的名字叫自省。(反射是 java 的说法，Python叫自省)
自省简单的说，就是用 python 的代码自己告诉这个对象是什么，有什么，以及祖宗是什么，子孙是什么....
python 提供的自省机制:help，dir 。其他的可以用这两个找到
十六·Python 代码规范(PEP8规范)

变量

常量：大写加下划线 USER_CONSTANT

私有变量 : 小写和一个前导下划线 _private_value（Python 中不存在私有变量，这只是程序员之间的一个约定，用于警告说明这是一个私有变量，外部类不要去访问它。但实际上，外部类还是可以访问到这个变量）

内置变量 : 小写，两个前导下划线和两个后置下划线 class（前导下划线会导致变量在解释期间被更名。这是为了避免内置变量和其他变量产生冲突。用户定义的变量要严格避免这种风格）

函数和方法

总体：小写和下划线。

私有方法：小写和一个前导下划线

特殊方法：小写和两个前导下划线，两个后置下划线
这种风格只应用于特殊函数，比如操作符重载等。

函数参数 : 小写和下划线，缺省值等号两边无空格

类
类总是使用驼峰格式命名，所有单词首字母大写其余字母小写。类名应该简明，精确，并足以从中理解类所完成的工作。常见的一个方法是使用表示其类型或者特性的后缀
模块和包
除特殊模块 init 之外，模块名称都使用不带下划线的小写字母。
参数
不要用断言来实现静态类型检测。
不要滥用 *args 和 **kwargs。
其他
1.使用 has 或 is 前缀命名布尔元素
is_connect = True
2.验证脚本
可以安装一个 pep8 脚本用于验证你的代码风格是否符合 PEP8

1-5：原文链接

6-15：《黑马程序员》

python基础1

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读