Python基础学习2：Python基础概念

作者: Andy_Ron | 来源:发表于2017-10-02 08:16 被阅读84次

# print absolute value of an integer:
a = 100
if a >= 0:
    print(a)
else:
    print(-a)

自然语言在不同的语境下有不同的理解，而计算机要根据编程语言执行任务，就必须保证编程语言写出的程序决不能有歧义
# 是注释，其他每一行都是一个语句，当语句以冒号“:”结尾时，缩进的语句视为代码块。
Python程序是大小写敏感的
缩进的坏处就是“复制－粘贴”功能失效了，这是最坑爹的地方。

数据类型和变量

字符串可以用单引号'或双引号"
字符串内部既包含'又包含"用转义字符\来标识

'I\'m \"OK\"!'

用r''表示''内部的字符串默认不转义

>>> print '\\\t\\'
\       \
>>> print r'\\\t\\'
\\\t\\

多行字符串 '''...'''

print('''line1
line2
line3''')

布尔值： True False
布尔值可以用and、or和not运算
空值 None
Python没有常量，只是习惯上用全部大写的变量名来表示“常量”
/除法计算结果是浮点数，即使是两个整数恰好整除

>>> 9 / 3
3.0

//称为地板除，两个整数的除法仍然是整数(去掉小数部分)

>>> 10 // 3
3

字符编码

ASCII ： 127个字符
Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了
UTF-8编码把Unicode编码转化为“可变长编码”的。
UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。
在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件：

浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器：

Python的字符串

Python 3版本中，字符串是以Unicode编码的。
ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符：

>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'

十六进制的字符串

>>> '\u4e2d\u6587'
'中文'

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

bytes类型的数据表示： x = b'ABC'
以Unicode表示的str通过encode()方法可以编码为指定的bytes :

>>> 'ABC'.encode('ascii')
b'ABC'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> '中文'.encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

纯英文的str可以用ASCII编码为bytes，内容是一样的，含有中文的str可以用UTF-8编码为bytes。含有中文的str无法用ASCII编码，因为中文编码的范围超过了ASCII编码的范围，Python会报错。

在bytes中，无法显示为ASCII字符的字节，用\x##显示。
把bytes变为str，就需要用decode()方法：

>>> b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'

len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：

>>> len(b'ABC')
3
>>> len(b'\xe4\xb8\xad\xe6\x96\x87')
6
>>> len('中文'.encode('utf-8'))
6

为了避免乱码问题，应当始终坚持使用UTF-8编码对str和bytes进行转换。
由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。

# -*- coding: utf-8 -*-

格式化

>>> '%2d-%02d' % (3, 1)
' 3-01'
>>> '%.2f' % 3.1415926
'3.14'
>>> 'Age: %s. Gender: %s' % (25, True)
'Age: 25. Gender: True'

如果你不太确定应该用什么，%s永远起作用，它会把任何数据类型转换为字符串。

使用list和tuple

list是一种有序的集合，里面的元素的数据类型可以不同

classmates = ['Michael', 'Bob', 'Tracy']
classmates[-1]
classmates.append('Adam')
classmates.insert(1, 'Jack')
classmates.pop()          # 删除list末尾的元素
classmates.pop(1)        # 删除指定位置的元素
classmates[1] = 'Sarah'
len(classmates)

tuple和list非常类似，但是tuple一旦初始化就不能修改

>>> classmates = ('Michael', 'Bob', 'Tracy')

能用tuple代替list就尽量用tuple
只有1个元素的tuple定义时必须加一个逗号,，来消除歧义 t = (2)
在tuple中放入list，这样看上去就能修改tuple tt = ("a", "b", [4,5,9])

条件判断

if age >= 18:
    print('your age is', age)
    print('adult')
else:
    print('your age is', age)
    print('teenager')


if age >= 18:
    print('adult')
elif age >= 6:
    print('teenager')
else:
    print('kid')

循环

for x in ... : 把每个元素代入变量x，然后执行缩进块的语句。
range()

sum = 0
for x in range(101):
    sum = sum + x
print(sum)

while
break
continue语句，跳过当前的这次循环，直接开始下一次循环。

使用dict和set

dict

    d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
    d['Michael']
    d.get('Thomas')     # None
    d.get('Thomas', -1) # -1
    d.pop('Bob')

和list比较，dict有以下几个特点：
- 查找和插入的速度极快，不会随着key的增加而增加；
- 需要占用大量的内存，内存浪费多。
dict的key必须是不可变对象。
dict的key不存在时会包KeyError错误，可通过in或get()方法来判断。

>>> 'Thomas' in d
False

dict要删除一个key，用pop(key)方法，对应的value也会从dict中删除：

 >>> d.pop('Bob')
75
>>> d
{'Michael': 95, 'Tracy': 85}

set(数学意义上的无序和无重复元素的集合)和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。

>>> s = set([1, 1, 2, 2, 3, 3])
>>> s
{1, 2, 3}
>>> s.add(4)
>>> s
{1, 2, 3, 4}
>>> s.remove(4)
>>> s
{1, 2, 3}

set是无序的
对于不变对象来说，调用对象自身的任意方法，也不会改变该对象自身的内容。相反，这些方法会创建新的对象并返回，这样，就保证了不可变对象本身永远是不可变的。

参考：《Python教程》

网友评论

程序员

本文标题：Python基础学习2：Python基础概念

本文链接：https://www.haomeiwen.com/subject/muryextx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！