Python代码块缓存、小数据池

作者: mengkaidi | 来源:发表于2019-03-24 10:22 被阅读0次

Python代码块缓存、小数据池
代码块缓存、小数据池
享元模式
LeetCode 146 LRU缓存机制
HTTP缓存协议实战
每日记录之MysqlInnoDB缓存
Python多线程爬取王者荣耀COS小姐姐图片集
Python 入门之代码块、小数据池与深浅拷贝
php内存缓存实现程序代码
InnoDB体系架构

引子

前几天遇到了这样一道Python题目：a=‘123’，b=‘123’，下列哪个是正确的？
A. a != b
B. a is b
C. a==123
D. a + b =246

正确答案是B

是的，我选错了，我当时觉得没有正确答案，原因是我当时已经知道Python中 == 与 != 是比较两边的数值是否相等，很显然 a==b，我也知道 is 比较的是两边的内存地址是否相同，而内存地址是否相同是通过比较 id(a) 是否等于id(b)来知道的，而我想当然地认为a和b是两个不一样的变量，内存地址肯定不相同，于是认为B选项是错误的。然而，我不知道的是，Python中还存在有代码块缓存、 小数据池 的概念。对于Python我只是直接上手写代码了，觉得很简单，然而对于其背后的深层知识还有很多欠缺，以后需要多多学习和记录总结。

代码块的缓存机制

代码块

Python程序是由代码块构造的，一个模块、一个函数、一个类、一个文件等都是一个代码块，特别地，在Python解释器交互环境中，每个命令都是一个代码块。

缓存机制

Python在执行同一个代码块时，遇到初始化变量的命令时，它会将初始化的这个变量与其值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果该变量对应的值的记录已经存在，则该变量会重复使用这个值，即会把前后两个变量指向同一个值对象，值对象在内存中只存在一个。这就是代码块的缓存机制，缓存机制的适用类型有：int、float、str、bool。

int、float：任何数字在同一代码块下都会复用；
bool：True和False在字典中会以1和0的方式存在，因此也都会被复用；
str：缓存机制符合一下规则：

非乘法得到的字符串都会被缓存复用，如；

s1='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls'
s2='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls'
print(s1 is s2)  # True

乘法得到的字符串分两种情况：
1）乘数为1时，同非乘法得到的字符串一样，都满足代码块的缓存机制，如：

s1='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls' * 1
s2='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls' * 1
print(s1 is s2)  # True

2）乘数>=2时，仅包含大小写字母、数字、下划线并且总长度 <=20 的字符串才满足代码块的缓存机制，如：

s1='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls' * 2
s2='中文xa#!@jndslskkaskakskkkkkkkkdfjkd()&*^$$ksjfkls' * 2
print(s1 is s2)  # False 总长度超过20且包含除字母、数字、下划线的字符

s3='中文xa#!@j' * 2
s4='中文xa#!@j' * 2
print(s3 is s4)  # False 包含除字母、数字、下划线的字符

s5='2a_j' * 6
s6='2a_j' * 6
print(s5 is s6)  # False 总长度超过20

s7='2a_j' * 5
s8='2a_j' * 5
print(s7 is s8)  # True

小数据池

小数据池即小整数缓存机制，Python自动将 -5～256 之间的整数进行了缓存，也将一定规则的字符串在字符串驻留池中创建了一份，即在内存中只创建一份。它主要是针对不同代码块之间的缓存机制。

1.int ：小数据池的范围是 -5～256，多个变量都指向在此范围内的同一个数字时，它们在内存中都指向同一个内存地址，超过此范围则指向不同的内存地址，以命令行为例（每行命令为一个代码块，不同行的命令为不同的代码块）：

>>> a=256
>>> b=256
>>> a is b
True

>>> a=257
>>> b=257
>>> a is b
False

>>> a=-5
>>> b=-5
>>> a is b
True

>>> a=-6
>>> b=-6
>>> a is b
False

这里，我还顺便试了一下float类型的数据是否符合此原则,实事实证明是不符合的：

>>> a=0.0
>>> b=0.0
>>> a is b
False

>>> a=-0.1
>>> b=-0.1
>>> a is b
False

bool：相当于整数中的1和0，因此满足缓存复用：

>>> a = True
>>> b = True
>>> a is b
True

字符串：依然分为好几种情况：

长度为0或者1，默认都采用了驻留机制：

>>> s1='a'
>>> s2='a'
>>> s1 is s2
True

>>> s3=''
>>> s4=''
>>> s3 is s4
True

>>> s5='#'
>>> s6='#'
>>> s5 is s6
True

长度>1，仅包含字母、数字、下划线时，才会采用驻留机制：

>>> s1='@a'
>>> s2='@a'
>>> s1 is s2
False

>>> s3='s____s111111111111aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa'
>>> s4='s____s111111111111aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa'
>>> s3 is s4
True

用乘法得到的字符串，乘数为1时，仅含字母、数字、下划线时(不限制长度)，才会采用驻留机制，其它字符乘数为1且长度<=1时，才会采用驻留机制：

>>> s1='@'*1
>>> s2='@'*1
>>> s1 is s2
True

>>> s3='@#a'*1
>>> s4='@#a'*1
>>> s3 is s4
False

用乘法得到的字符串，乘数 >=2 时，仅含字母、数字、下划线且总长度<=20，才会采用驻留机制:

>>> s1='ab_@'*5
>>> s2='ab_@'*5
>>> s1 is s2
False #包含其它字符

>>> s3='ab_1'*6
>>> s4='ab_1'*6
>>> s3 is s4
False #总长度超过20

>>> s5='ab_1'*5
>>> s6='ab_1'*5
>>> s5 is s6
True

指定驻留

除了小数据池规则以外，你可以指定任意的字符串加入到小数据池中，让其只在内存中创建一个对象，多个变量都是指向这一个字符串，这就是指定驻留，方法如下：

>>> from sys import intern  #python2中import貌似会报错
>>> s1 = intern('ab_@'*5)
>>> s2 = intern('ab_@'*5)
>>> s1 is s2
True

总结

如果在同一代码块下，则采用同一代码块下的换缓存机制；
如果是不同代码块，则采用小数据池的驻留机制，该机制比代码块缓存机制要严格一些；
特殊情况下，采用指定驻留。

写完自己都有点晕了，的确容易记混出错，不过没关系啦，先知道有这么个规则概念，然后多去手动尝试使用就好啦，加油，共勉～

网友评论

编程

本文标题：Python代码块缓存、小数据池

本文链接：https://www.haomeiwen.com/subject/nmuyvqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python代码块缓存、小数据池

引子

代码块的缓存机制

代码块

缓存机制

小数据池

指定驻留

总结

相关文章

Python代码块缓存、小数据池

代码块缓存、小数据池

享元模式

LeetCode 146 LRU缓存机制

HTTP缓存协议实战

每日记录之MysqlInnoDB缓存

Python多线程爬取王者荣耀COS小姐姐图片集

Python 入门之代码块、小数据池与深浅拷贝

php内存缓存实现程序代码

InnoDB体系架构

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

编程