美文网首页
python字符串相关总结

python字符串相关总结

作者: 发家致富靠养猪 | 来源:发表于2018-11-08 21:59 被阅读0次

    1.什么是字符串

    序列,有序,不可变的。
    用单引号或者双引号括起来的任意字符集。


    2.字符串中的字符

    a.普通字符: 如:'23','ashNHJ','-=+!$@% #^&><?', '上的惊世毒妃', '🌲🐶🌺'
    b.转义字符:\n, \t, ', ", \
    阻止转义:r/R


    3.字符编码

    python中的字符采用的是Unicode编码

    a.什么是编码

    就是数字和字符的一一对应的,其中字符对应数字就是字符的编码

    如:
    a - 97
    b - 98

    b.编码方式

    ASCII码表:针对数字字符、字母字符、一些英文中常用的符号进行编码
    采用一个字节对字符进行编码(128个字符)

    Unicode码:Unicode码包含了ASCII码表,同时能够对世界上所有语言对应符号进行编码
    采用两个字节对字符进行编码,能编码65536个字符
    中文:4E00 ~ 9FA5

    c.两个函数
    • chr(编码值) - 将字符编码转换成字符
    • ord(字符) - 获取字符对应的编码值
    print(chr(0x4E01))
    yu = ord('余')
    ting = ord('婷')
    print(hex(yu), hex(ting))
    

    结果如下

    image.png
    d.可以将字符编码放到字符串中便是一个字符: \u + 4位的16进制编码值
    str1 = 'abc\u4f59123\u1234'
    print(str1)
    

    结果如下


    4.获取字符串中的字符

    • 一旦一个字符串确定,那么字符串中每个字符的位置就确定。
    • 而且每个字符会对应一个用来表示其位置和顺序的下标值。

    1.下标(索引)

    • 字符串中的每个字符都有一个下标,代表其在字符串中的位置
    • 下标的范围是: 0 ~ 字符串长度-1 (0代表第一个字符的位置)
      -1 ~ -字符串长度 (-1代表最后一个字符的位置)
    'abc'   # 'a': 0/-3   'b':1/-2  'c':2/-1
    'abc\n123'  # '1': 4/-3
    'abc\u4eff1234' # '1': 4/-3
    

    2.获取单个字符

    • 语法:字符串[下标] - 获取字符串中,指定下标对应的字符
    • 说明: 字符串 - 可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
      • [] - 固定写法
      • 下标 - 字符的下标,不能越界
    str1 = 'hello python'
    print(str1[6], str1[-6])
    print(str1[-2])
    # print(str1[12])  # IndexError: string index out of range
    # print(str1[-20])  # IndexError: string index out of range
    

    结果如下:

    image.png

    3.获取部分字符

    方法1:

    a.语法:字符串[开始下标:结束下标:步长]
    b.说明:字符串 - 可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
    • [] - 固定写法
    • : - 固定写法
    • 开始下标、结束下标 - 下标值
    • 步长 - 整数
    c.功能:
    • 从开始下标开始获取到结束下标前为止, 每次下标值增加步长对应的值。结果是字符串
    d.注意:
    • 当步长是正数(从前往后取), 开始下标对应的字符要在结束下标对应的字符的前面

    • 当步长是负数(从后往前取),开始下标对应的字符要在结束下标对应的字符的后面

    • 结束下标对应的值取不到的

    str1 = 'abcdefghij'
    print(str1[0:6:1])
    # abcdef
    print(str1[0:6:2])
    # ace
    
    print('==:',str1[-1:6:-1])
    
    print(str1[-1:2:-2])
    

    结果如下

    image.png

    方法2:

    语法:字符串[开始下标:结束下标] (相当于步长是1)

    str1 = 'abc123abc'
    print(str1[-1:3])  # '' - 空串
    print(str1[3:-1])
    

    结果如下

    image.png

    4.获取部分字符,省略下标

    • 获取部分字符的时候,开始下标和结束下标都可以省略
    a.开始下标省略
    • 字符串[:结束下标:步长] 或者 字符串[:结束下标]
    • 步长是正数:从字符串开头开始往后获取
    • 步长是负数:从字符串结尾开始往前获取
    str1 = 'abc123abc'
    print(str1[:4:1])
    print(str1[:4:-1])
    

    结果如下

    image.png
    b.结束下标省略
    • 字符串[开始下标::步长] 或者 字符串[结束下标:]
    • 步长是正数:从开始下标从前往后获取到字符串结束
    • 步长是负数:从开始下标从前后往前获取到字符串开头
    print(str1[4:])
    print(str1[4::-1])
    
    print(str1[:])
    print(str1[::-1])  # 字符串倒序
    print(str1[-100:100])  # 这儿的开始下标和结束下标都可以越界
    

    结果如下

    image.png

    5.字符串相关运算

    1. +

    • 字符串1 + 字符串2: 将两个字符串拼接在一起产生一个新的字符串(不会修改原字符)

      注意:字符串相加,加号两边必须都是字符串

    str1 = 'abc'
    str2 = '123'
    print(str1 + str2, str1, str2)
    
    # print(str2+10)  # TypeError: must be str, not int
    print(str2+'10')  # 12310
    

    结果如下

    image.png

    2. *

    • 字符串 * n(正整数):字符串的内容重复n次,产生一个新的字符串
    str1 = 'abc'
    print(str1*3)
    print('*'*10)
    
    # 练习: 10个*跟10个%   ***..%%%..
    print(('*'*10+'%'*10)*3) #**********%%%%%%%%%%**********%%%%%%%%%%**********%%%%%%%%%%
    

    结果如下

    image.png

    3.比较运算符: >,<. ==, !=, >=, <=

    a. ==, !=
    • 字符串1 == 字符串2 - 判断两个字符串是否相等
    print('abc' == 'abc') #True
    print('abc' != 'abc') #False
    print('abc' == 'cba') #False
    
    b.. >, <, >=, <=
    • 两个字符串比较大小:从第一个开始,找到第一对不同的字符,然后比较他们的编码值的大小
    print('abc' > 'ad')  # False
    print('abcdZ' > 'abcde' )  # False
    print('1abc' < 'ahkks')  # True
    
    # 练习:判断一个字符是否是字母
    # char = input('请输入一个字符:')
    char = 'a'
    print('是否是字母:', 'a' <= char <= 'z' or 'A' <= char <= 'Z')
    
    # 练习:判断一个字符是否是中文
    print('是否是中文:', '\u4e00' <= char <= '\u9fa5')
    print('是否是中文:', 0x4e00 <= ord(char) <= 0x9fa5)
    print('是否是中文:', '一' <= char <= '龥')
    

    结果如下

    image.png

    4. in 和 not in

    • 字符串1 in 字符串2:判断字符串2中是否包含字符串1,结果是布尔
    • 字符串1 not in 字符串2:判断字符串2中是否不包含字符串1,结果是布尔
    print('abc' in 'abc123')  # True
    print('abc' in 'ab123c')  # False
    print('abc' not in 'ab123c')  # True
    print('#' in 'ahs#hf#23')   # True
    

    5.len函数

    len(序列)
    len(字符串) - 获取字符串中字符的个数

    print(len('abc123')) #6
    print(len('abc\n123\u4edd'))  # 8
    print(len('abc\n123\\u4edd')) # 13
    print(len(r'abc\n123\u4edd')) # 14
    print(len('abc\t1 23'))  # 8
    

    6.str

    • str(数据);将数据转换成字符串
    a.其他数据转换成字符串:
    • 所有的类型的数据都可以转换成字符串。转换的时候就是在数据的值的最外面加引号

    补充:系统数据类型名不能用来给变量命名

    str1 = str(100)
    print(str1, type(str1))  #100
    
    b.字符串转其他类型
    • 字符串转整数: int(字符串), 只有去掉引号后剩下的部分本身就是一个整数的字符串才能转换成整型
    • 字符串转浮点型: float(字符串),只有去掉引号后剩下的部分本身就是一个整数或者小数的字符串才能转换成浮点型
    • 字符串转布尔: bool(字符串), 除了空串会转换成False,其他所有的字符串都会转换成True
    print(int('-123'))  #-123
    print(float('12.89'), float('123'), float('2e3'))  #12.89   123.0    2000.0
    print(bool('0'), bool('False'))   # True
    print(bool(''))  # False
    

    6.格式字符串

    1.格式字符串

    • 指的是字符串中通过格式占位符来表示字符串中变化,然后后面再通过其他的值来给占位符赋值

    • 语法:
      含有格式占位符的字符串 % (占位符对应的值)

    • 说明:格式占位符 - 有固定的写法;可以有多个
      % - 固定写法
      () - 里面的值的个数和值的类型要和前面的格式占位符一一对应

    2.常见格式占位符

    %d - 整数
    %s - 字符串
    %.nf - 小数(保留小数点后n位小数)
    %c - 字符 (可以将数字转换成字符)

    name = input('名字:')
    message = '%s你好,吃饭了吗?' % (name)
    print(message)
    
    message = '%s,今年%d岁,体重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
    print(message)
    
    message = name + ',今年'+ str(18+2)+'岁,体重:'+ str(65)+'kg 血型是:'+chr(97)
    print(message)
    

    结果如下

    image.png

    7.字符串常用方法

    1.字符串.capitalize() - 将字符串第一个字符转换成大写

    str1 = 'hello'
    new_str = str1.capitalize()
    print(new_str)  # Hello
    

    2.字符串对齐

    字符串.center(width, fillchar) - 居中
    字符串.ljust(width, fillchar) - 左对齐
    字符串.rjust(width, fillchar) - 右对齐
    width - 正整数,表示新的字符串的宽度
    fillchar - 字符, 填充字符串

    str1 = '123'
    new_str = str1.center(7, '/')
    print(new_str) # //123//
    
    new_str = str1.ljust(7, '/')
    print(new_str)  # 123////
    
    new_str = str1.rjust(7, '/')
    print(new_str)  # ////123
    

    3. isalpha()

    • 字符串.isalpha() - 如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False
    str1 = '23434'
    print(str1.isalpha()) #False
    

    4. isdigit()

    • 字符串.isdigit() - 如果字符串只包含数字则返回 True 否则返回 False.
    str1 = '壹23万萬43幺一百'
    print(str1.isdigit()) #False
    

    5.isnumeric()

    • 字符串.isnumeric() - 如果字符串中只包含数字字符,则返回 True,否则返回 False(中文数字也可以)
    print(str1.isnumeric()) #True
    

    6.join(seq)

    • 字符串1.join(字符串2): 将字符串1的内容插入到字符串2的每个字符之间
    str1 = '**'
    str2 = 'abc'
    print(str1.join(str2))  # a**b**c
    

    7.max(字符串)和min(字符串)

    print(max('ahajsxnzhsjdf234')) # z
    print(min('ahajsxnzhsjdf234')) # 2
    

    8.replace(old, new [, max])

    • 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。
    print('agskshabkkhabba'.replace('a', '/')) # /gsksh/bkkh/bb/
    

    9.split(str="", num=string.count(str))

    • num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串
    print('agsk*shabkk*habba'.split('*')) # ['agsk', 'shabkk', 'habba']
    

    10. count(str)

    • 返回 str 在 string 里面出现的次数
    str1 = "askjdbasa"
    print(str1.count("a")) # 3
    

    11.startswith(str, beg=0,end=len(string)),endswith(suffix)

    • startswith(str, beg=0,end=len(string)):检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
    • endswith(suffix):检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
    str1 = "askj    dbasa"
    print(str1.startswith("a")) # True
    print(str1.startswith("c")) # False
    

    12.expandtabs()

    • 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
    str1 = "askj    dbasa"
    print(str1.expandtabs()) # askj    dbasa
    

    13.find(str, beg=0 end=len(string)), index(str, beg=0, end=len(string))

    • find(str, beg=0 end=len(string)):检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
    str1 = "askj    dbasa"
    print(str1.find("k", 0,10)) # 2
    print(str1.find("o", 0,10)) # -1
    
    • index(str, beg=0, end=len(string)):检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则会报一个异常
    str1 = "askj    dbasa"
    print(str1.index("k", 0,10)) # 2
    print(str1.index("o", 0,10)) # ValueError: substring not found
    

    14.islower()

    • 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
    str1 = "askj    dbasa"
    print(str1.islower()) # True
    str2 = "13241657"
    print(str2.islower()) # False
    

    15.isnumeric()

    • 如果字符串中只包含数字字符,则返回 True,否则返回 False(中文数字也可以)
    str3 = '壹23万萬43幺一百'
    print(str3.isnumeric()) # True
    str1 = "askj    dbasa"
    print(str3.isnumeric()) # False
    

    16.isspace()

    • 如果字符串中只包含空白,则返回 True,否则返回 False.
    str1 = "askj    dbasa"
    str4 = "    "
    print(str1.isspace()) # False
    print(str4.isspace()) # True
    

    17.istitle()

    • 如果字符串是标题化的(见 title())则返回 True,否则返回 False
    str1 = "askj    dbasa"
    str5 = "This Is String Example...Wow!!!"
    print(str5.istitle()) # True
    print(str1.istitle()) # False
    

    18.isupper() , islower()

    • isupper():如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
    str1 = "askj    dbasa"
    str6 = "ASDFASDFAS"
    print(str6.isupper()) # True
    print(str1.isupper()) # False
    
    • islower():如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
    str1 = "askj    dbasa"
    str6 = "ASDFASDFAS"
    print(str6.islower()) # False
    print(str1.islower()) # True
    

    19.lstrip() , rstrip()

    • .lstrip() :截掉字符串左边的空格或指定字符。
    str7 = "  dsa12"
    print(str7.lstrip()) #dsa12
    str8 = "*dsa12"
    print(str8.lstrip(*)) #dsa12
    
    • rstrip():删除字符串字符串末尾的空格
    str9 = "*dsa12*"
    print(str9.rstrip("*"))  #*dsa12
    str10 = "*dsa12  "
    print(str10.rstrip("*"))  #*dsa12
    

    20.lower(),upper()

    • lower():转换字符串中所有大写字符为小写.
    str6 = "ASDFASDFAS"
    print(str6.lower()) # asdfasdfas
    
    • upper():转换字符串中的小写字母为大写
    str1 = "askj    dbasa"
    print(str1.upper()) # ASKJ    DBASA
    

    21.title()

    • 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())
    str1 = "askj    dbasa"
    print(str1.title()) # Askj    Dbasa
    

    22.isdecimal()

    • 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。
    str1 = "askj    dbasa"
    print(str1.isdecimal()) # False
    str2 = "13241657"
    print(str2.isdecimal()) # True
    

    23.字符串.zfill (width) - 返回长度为 width 的字符串,原字符串右对齐,前面填充0

    str2 = "adsd Da ce Aeea"
    print(str2.zfill(20)) #  00000adsd Da ce Aeea
    

    24.swapcase()

    • 将字符串中大写转换为小写,小写转换为大写
    str5 = "This Is String Example...Wow!!!"
    print(str5.swapcase()) # tHIS iS sTRING eXAMPLE...wOW!!!
    

    相关文章

      网友评论

          本文标题:python字符串相关总结

          本文链接:https://www.haomeiwen.com/subject/vnxgxqtx.html