美文网首页
面试之Python 生疏知识点总结

面试之Python 生疏知识点总结

作者: 打出了枫采 | 来源:发表于2018-07-04 17:14 被阅读0次

Python中确实有很多点,平时使用接触较少,而相对生疏。下面是前段时间找工作时遇到的,虽然我最终没能去个以python为主要开发语言的岗位~ ~ ~
下面内容 一部分时截取自网络,一部分是截取自python相关书籍,个别示例为个人理解所举。

1. Unicode 与 字符串string的 区别

字符串编码的差异,体现在计算机内存中存储字符的方式的差异,简单说同样的字符串不同编码方式存储时,其在计算机内存中的二进制值是不一样的。
  • ASCII标准,8位字节存储单个字符(二进制数值范围0-127)
    Unicode文本,通常叫做“宽字符”字符串,因为单个字符可能会用多个字节表示。通常用在表示国际化的程序中,以支持欧洲和亚洲的字符集(如汉字,日文,俄文等形式字符)。

  • 字节和字符串之间的来回转换:
    编码是根据一种具体编码方式,把一个字符串转换成其编码方式对应原始字节序列,简单理解一种编码方式指定了一种 字符映射字节序列表。
    解码则是编码的逆过程。

原始字节可理解为计算机存储时的二进制数串
ASCII是其它编码方式的子集,其它编码方式如 UTF-8,gbk系列等 都是Unicode。

  • Python 2.x中:
    str字符串类型与unicode字符串类型是不同的数据类型,
    str用于8位字节可以表示的文本,以及绝对字节值所表示的二进制数据(ASCII方式)。
    unicode用于表示宽字符文本,支持编码和解码。
    举个例子简单理解 a = ‘a234gj’ b = 0x61 (字符‘a’二进制数值就是97)
    A = “啊sdad”, a 和b 是str类型,A是unicode类型

  • Python3.x中的变化差异:
    str表示Unicode文本(8位和更宽的);
    bytes表示二进制数据。
    bytearray 是一种可变的bytes类型
    str 是不可改变的字符序列,bytes为一个8位整数的不可变序列,表示绝对的字节值,bytearray 是可变的,并支持原处修改。
    raw 字节数据,如图像和声音数据,应用于设备接口数据等,是没有经过任何方式编码的数据,通常用二进制数据来处理。

当一个文件以文本模式打开时,读取数据时会自动将其内容解码(平台的默认编码方式);
当一个文件以二进制方式打开时,则不会进行解码,读取的数据就是内存中的原始二进制数据。

2. 内存管理与垃圾回收

python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。
总结一下对象会在一下情况下引用计数加1:
1.对象被创建:x=4
2.另外的别人被创建:y=x
3.被作为参数传递给函数:foo(x)
4.作为容器对象的一个元素:a=[1,x,'33']
引用计数减少情况
1.一个本地引用离开了它的作用域。比如上面的foo(x)函数结束时,x指向的对象引用减1。
2.对象的别名被显式的销毁:del x ;或者del y
3.对象的一个别名被赋值给其他对象:x=789
4.对象从一个窗口对象中移除:myList.remove(x)
5.窗口对象本身被销毁:del myList,或者窗口对象本身离开了作用域。

内存池管理机制,减少频繁的小块系统内存的申请与释放

循环垃圾回收器, 确保释放循环引用对象(a引用b, b引用a, 导致其引用计数永远不为0)
分代收集
这个机制的主要作用就是发现并处理不可达的垃圾对象。
垃圾回收=垃圾检查+垃圾回收
在Python中,采用分代收集的方法。把对象分为三代,一开始,对象在创建的时候, 放在一代中,如果在一次一代的垃圾检查中,该对象存活下来,就会被放到二代中,同 理在一次二代的垃圾检查中,该对象d存活下来,就会被放到三代中。后续一代的检查中不会检查二代中的对象。

3. python线程特点

Python代码的执行由Python虚拟机(解释器)来控制。Python在设计之初就考虑要在主循环中,同时只有一个线程在执行,就像单CPU的系统中运行多个进程那样,内存中可以存放多个程序,但任意时刻,只有一个程序在CPU中运行。同样地,虽然Python解释器可以运行多个线程,只有一个线程在解释器中运行。
对Python虚拟机的访问由全局解释器锁(GIL)来控制,正是这个锁能保证同时只有一个线程在运行。在多线程环境中,Python虚拟机按照以下方式执行。
1.设置GIL。
2.切换到一个线程去执行。
3.运行。
4.把线程设置为睡眠状态。
5.解锁GIL。
6.再次重复以上步骤。
Python 多线程适合IO密集型程序,在一个线程等待IO输入时,其它线程可以得到调度。

4. 其它

== 和 is 的差异 一个比较内存值,一个比较的时对象标识id,相当于内存地址
copy 与deepcopy 不变性与相对不变性的差异
闭包 local 变量,很奇怪的概念,函数执行结束后,但是内部的local变量并未随函数消失,后续的调用会使用上一次保留的值,有些像C函数内部的static 变量,使用起来会令人困惑,很少用。

装饰器 在不改变函数的情况下,扩展函数的功能,非常强大好用

def  decorator(func):
      # Process function func with extra codes
      return func
def  decorator(func):    # 包装器
      # save or use function func 
      # return a different callable nested def 

Python内置协议机制 类似于C++的运算符重载
_repr_ 对应print
_callable_ 类名方法
_add_ + 操作运算
_iter_ 循环递归协议 for i in I
_item_ [ ]

函数重载,与C++类似
args args 区别 func(a,b,c) func((1,2,3)) -> func(1,2,3) func({‘a’:1,’b’:2,’c’:3})

相关文章

网友评论

      本文标题:面试之Python 生疏知识点总结

      本文链接:https://www.haomeiwen.com/subject/tmxyuftx.html