一、字符串
1.什么是字符串
字符串:就是用单引号或者双引号括起来的字符集
字符:就是引号中单独的符号、数字、单词、汉字等
'123' #数字字符串
'afjl'
'&^*%$'
'12sf$%'
'汉字'
' ' (空串)
转义字符:是用来表示一些特殊功能或者特殊意义的字符(通过在固定的字符前加\来表示)
\' --->'
str1='\''
print(str1) #'
\\ --->\
str2='\\'
print(str2) #\
\n --->换行
str3='床前明月光,\n疑是地上霜。'
print(str3) #床前明月光,
疑是地上霜。
\t --->制表符
\r --->回车
\" --->"
2.阻止转义
python中可以通过r(或R),来阻止转义字符转义
例:打印\\
方法1:str1='\\\\'
方法2:str2=r'\\' 或者 str2=R'\\'
3.Unicode编码
- 3.1 python中字符串中的字符是Unicode编码
- 3.2 Unicode编码(万国码):使用16位对一个字符进行编码
- 3.3 编码的目的是:让字符可以存储到计算机中
- 3.4 Unicode编码包含ASSCII码,可以表示世界上所有的语言和符号
- 3.5 ord(字符) --->Unicode码
- 3.6 chr(Unicode码 ) --->字符
(1)获取一个字符的Unicode编码(ord)--->ord(字符)
print(hex(ord('郑')),hex(ord('丽'))) #0x90d1 0x4e3d
(2)将一个Unicode编码转换成字符 (chr)--->chr(编码值)
print(chr(0x4e00)) # 一
(3)字符串比较大小的时候,从字符串开始依次往后比较每个字符的大小,直到遇到字符不一样为止
(4)比较字符大小的时候,实质比的是他们的编码的大小(小写字母大于对应的大写字母)
print('abc'>'b') #False
print('a'<'ab') #True
print(hex(ord('a')),hex(ord('A')),hex(ord('z')),hex(ord('Z')))
#0x61 0x41 0x7a 0x5a
print('A'<'a') #True
print('a'<'Z') #False
中文Unicode.png
二、获取字符串的字符
python的字符串,实质是一个有序的字符序列
1.获取字符串的长度:(长度是指字符的个数)
count=len('a b 1 2')
print(count) #7 (空格也是字符串的1个长度)
count=len('abc\n123')
print(count) #7 (\n是一个转义字符,换行键,属于一个字符)
2.通过下标获取字符串中的某一个字符
-
字符串中的每个字符都对应一个下标(索引),我们可以通过索引值
-
去获取固定的字符:字符串[索引值]
-
字符串[开始索引:结束的索引]
-
字符串[开始索引:结束的索引:步进] 开始索引 开始索引+步进
str1='a2j2h1'
print(str1[0]) #a
str2="good good study\nday day up"
print(str2[25]) #p
下标的范围:0-(字符串长度-1);或者(-1)-(-字符串长度)
获取字符的时候,索引值不能操作索引的范围,否则会报错IndexError
str3='abc'
#print(str3[4]) #IndexError: string index out of range(超出范围)
获取字符串,可以从后往前开始获取,下标从-1开始
总范围:(-1)~(-字符串长度)
print(str3[-1]) #c
3.获取字符串的部分字符串:字符串[开始下标:结束下标]--->区间左闭右开(包含开始,不含结束)
要求:开始下标对应的字符,要在结束下标对应的字符前面(步进是正数)
str4='hello Python'
print(str4[6:12]) #Python
print(str4[-6:12]) #Python
开始下标省略:从字符串的最开始,取到结束下标前
str4='hello Python'
print(str4[:5]) #hello
结束下标省略:从开始位置获取到结束下标前
str4='hello Python'
print(str4[6:]) #Python
两个都省略:获取整个字符串内容
str4='hello Python'
print(str4[:]) #hello Python
设置步进
str5='123456789'
print(str5[::2]) #13579
当步进是负数时,开始下标和结束下标的性质相反
str5='123456789'
print(str5[3:1:-1]) #43
字符串倒叙
str5='123456789'
print(str5[::-1]) #987654321
例:获取从第三个字符开始后面所有的字符
print(var[2:])
例:获取从第4个字符开始到倒数第二个的所有字符
print(var[4:-1]) #右边是开区间,取不到最后一个
三、字符串运算符
字符串运算符: + * in not in 占位符
1. +:字符串拼接
str1='hello' + ' '+ 'python'
print(str1) #hello python
注意:+ 两边要么都是数字,要么都是字符串,不可以一个是数字一个是字符串
# print(12+'34')
#TypeError: unsupported operand type(s) for +: 'int' and 'str'
2、 * :让字符串重复
字符串*整数
str1='abc'*3
print(str1) #abcabcabc
3. in ---> 字符串1 in 字符串2
判断字符串1是否在字符串2中
result='aa' in 'abaaac'
print(result) #True
result1='aa' in 'abac'
print(result1) #False
result2='a' in 'abc'
print(result2) #True
4. not in ---> 字符串1 not in 字符串2
判断字符串1是否不在字符串2中--->不在就True,在False
result='123' not in '12ac3'
print(result) #True
下表实例变量a值为字符串 "Hello",b变量值为 "Python":
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | a + b 输出结果: HelloPython |
* | 重复输出字符串 | a*2 输出结果:HelloHello |
[] | 通过索引获取字符串中字符 | a[1] 输出结果 e |
[ : ] | 截取字符串中的一部分 | a[1:4] 输出结果 ell |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | 'H' in a 输出结果 1 |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | 'M' not in a 输出结果 1 |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | print( r'\n' )print( R'\n' ) |
% | 格式字符串 | %s等 |
5.格式化字符串
格式:'占位符1占位符2'%(值1,值2)
在 Python 中,字符串格式化%s使用与 C 中 sprintf 函数一样的语法。
python字符串格式化符号:
符号 | 描述 |
---|---|
%c | 格式化长度是1的字符串及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%.nf | 使用n值限制小数点后面的小数位数(默认六位) |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
str1='abc%s12%s3'%('>>>','aaa')
print(str1) #abc>>>12aaa3
str2='-%s-%d-%f-%c-%e'%('字符串',+23,1.02,'a',10e2)
print(str2) #-字符串-23-1.020000-a-1.000000e+03
str3='金额:%.2f元'%(10.084)
print(str3) #金额:10.08元
如果后面没有加%,那么这个字符串只是一个普通的字符串
str4='我%d岁了'
print(str4) #我%d岁了
例:某某的十六进制是多少
number=15
str4='%d的十六进制是%x%X'%(number,number,number)
print(str4) #15的十六进制是fF
6.格式化输出
例:某某今天多少岁
name='小二'
age=18
print(('%s今年%d岁')%(name,age)) #小二今年18岁
四、字符串相关方法
字符串相关方法的通用格式:字符串.函数()
Python 的字符串常用内建函数如下:
序号 | 方法 | 描述 |
---|---|---|
1 | capitalize() | 将字符串的第一个字符转换为大写 |
2 | center(width, fillchar) | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
3 | count(str, beg= 0,end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
4 | bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
5 | encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
6 | endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
7 | expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
8 | find(str, beg=0 end=len(string)) | 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
9 | index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在字符串中会报一个异常. |
10 | isalnum() | 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False |
11 | isalpha() | 如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False |
12 | isdigit() | 如果字符串只包含数字则返回 True 否则返回 False.. |
13 | islower() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
14 | isnumeric() | 如果字符串中只包含数字字符,则返回 True,否则返回 False(中文数字也可以) |
15 | isspace() | 如果字符串中只包含空白,则返回 True,否则返回 False. |
16 | istitle() | 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
17 | isupper() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
18 | join(seq) | 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
19 | len(string) | 返回字符串长度 |
20 | ljust(width[, fillchar]) | 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。 |
21 | lower() | 转换字符串中所有大写字符为小写. |
22 | lstrip() | 截掉字符串左边的空格或指定字符。 |
23 | maketrans() | 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
24 | max(str) | 返回字符串 str 中最大的字母。 |
25 | min(str) | 返回字符串 str 中最小的字母。 |
26 | replace(old, new [, max]) | 把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。 |
27 | rfind(str, beg=0,end=len(string)) | 类似于 find()函数,不过是从右边开始查找. |
28 | rindex( str, beg=0, end=len(string)) | 类似于 index(),不过是从右边开始. |
29 | rjust(width,[, fillchar]) | 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
30 | rstrip() | 删除字符串字符串末尾的空格. |
31 | split(str="", num=string.count(str)) | num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串 |
32 | splitlines([keepends]) | 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
33 | startswith(str, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
34 | strip([chars]) | 在字符串上执行 lstrip()和 rstrip() |
35 | swapcase() | 将字符串中大写转换为小写,小写转换为大写 |
36 | title() | 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
37 | translate(table, deletechars="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
38 | upper() | 转换字符串中的小写字母为大写 |
39 | zfill (width) | 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
40 | isdecimal() | 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。 |
1.capitalize:将一个字符串的首字母转换成大写,并产生另一个新的字符串
str1='ajk'
new_str=str1.capitalize()
print(str1,new_str) #ajk Ajk 产生一个新的字符串
2.center(width,fillchar)居中对齐
将原字符串变成指定长度width并居中的字符串,fillchar是填充的字符,默认为空格
new_str=str1.center(10,'-')
print(str1,new_str) #ajk ---ajk----
3.rjust(width,fillchar) 右对齐
new_str=str1.rjust(10,'!')
print(str1,new_str) #ajk !!!!!!!ajk
4.ljust(width,fillchar) 左对齐
str2='你好'
new_str=str2.ljust(5,'!')
print(str2,new_str) #你好 你好!!!
例:产生学号
str(数据):将任何其他的数据转化成字符串
number=19
new_str=str(number)
num_str=new_str.rjust(3,'0')
print(num_str) #019
new_str='py1805'+ num_str
print(new_str) #py1805019
5.字符串1.join(字符串2)
在字符串2的每个字符之间插入字符串1的内容
new_str='aaa'.join('11')
print(new_str) #1aaa1
6.maketrans() :将第一个参数的元素作为字典的key,第二个参数的元素作为字典的值
new_str=str.maketrans('abc','123')
print(new_str) #{97: 49, 98: 50, 99: 51}
7.max() :比的是万国码
print(max("a13232dbsa")) #c
网友评论