美文网首页
Day8-字符串

Day8-字符串

作者: 略略略_29fd | 来源:发表于2019-08-14 19:54 被阅读0次

    字符串

    1.什么是字符串(str)

    1)字符串

    字符串是容器型数据类型(序列); 以单引号或者双引号作为容器的标志, 引号中所有的内容都输入字符串的元素
    'abc' -> 元素分别是'a','b','c', 3个元素
    'a,b,c' -> 分别是'a', ',', 'b', ',', 'c', 5个元素
    特点: 不可变,有序(支持下标操作)

    2)字符串的元素

    字符串中元素又叫字符(注意:python中有字符的概念,但是没有字符类型;长度是1的字符串就可以看成字符)

    a.普通字符:字母、数字、各国的文字和符号等(可以写在引号中的符号)

    'abc', 'abc123', '+-%abc胡说'

    b.转义字符: 字符串中在一些特定的符号前加\来表示特殊功能和意义

    ' - '
    " - "
    \n - 换行
    \ -
    \t - tab键(制表符)

    c.编码字符: \u4位16进制数 - 将4位16进制数对应的编码值转换成字符

    1)字符编码
    计算机只有直接存储数字的能力,不能直接存储字符;
    当需要计算机存储字符的时候,实质存的是字符对应的固定的数字,这个数字就是字符在计算机中的编码;
    每一个字符和数字的对应关系叫编码表

    2)ASCII码表和Unicode编码表
    ASCII码表是由美国国家标准制定的专门针对美国符号进行编码的,里面只包含一些特殊符号、字母和数字(不包含中文、日语、韩语等)
    python采用的是Unicode编码表: Unicode编码表是对ASCII表的扩展, 包含了世界上所有国家所有语言的符号(又叫万国码)
    中文范围: 0x4eoo ~ 0x9fa5

    3)字符编码相关方法
    chr(编码值) - 将编码值转换成字符
    ord(字符) - 获取字符对应的编码值

    1.字符串中的内容

    str1 = 'abc\'12\"3'
    str1 = "ab"c'123"
    print(str1)
    
    str2 = 'abc\n123'
    print(str2)
    
    str3 = '\tabc\\n123'
    str4 = '    abc\\n123'
    print(str3, len(str3), len(str4))
    
    str5 = "hh\u5e00abc"
    print(str5)
    
    str6 = 'abc 123'
    str7 = 'abc123'
    str8 = '1'
    num = 1
    

    2.字符编码

    print(chr(97), chr(65))
    print(chr(0x1800))

    for x in range(0x1800, 0x18af):
        print(chr(x), end=' ')
    print()
    
    for x in range(0x1100, 0x11ff):
        print(chr(x), end=' ')
    print()
    
    num = 0
    for x in range(0x4e00, 0x9fa5):
        num += 1
        print(chr(x), end=' ')
        if num % 35 == 0:
            print()
    print()
    
    ord()
    print(ord('余'), ord('婷'))
    print(hex(ord('余')), hex(ord('婷')))
    
    name1 = '余婷'
    name2 = '\u4f59\u5a77'
    print(name1, name2)
    
    print('z' > 'a')    # True
    print('Z' > 'a')    # False
    

    字符串相关操作

    1.获取字符 - 和列表获取元素一样

    str1 = 'hello world!'

    1)获取单个字符
    print(str1[0])   # 'h'
    print(str1[-2])  # 'd'
    
    2)字符串切片
    print(str1[2:6:2])  # 'lo'
    print(str1[2:6:-2])   # '' - 空串
    print(str1[3:])    # 'lo world!'
    print(str1[3::-1])  # 'lleh'
    
    3)遍历
    for char in 'abc':
        print(char)
    
    

    练习: 统计一个字符串中小写字母的个数

    str2 = 'How Are You! Im Fine, THANK YOU!'
    count = 0
    for char in str2:
        if 97 <= ord(char) <= 122:
            count += 1
    print('小写字母的个数:', count)
    

    2.字符串操作

    1) + 和 *

    字符串1+字符串2 -> 将字符串1和字符串2拼接在一起产生一个新的字符串
    字符串 * N / N * 字符串 -> 字符串重复N次产生一个新的字符串

    str1 = 'abc'
    str2 = '123'
    print(str1 + str2)    # 'abc123'
    print(str1 + ':' + str2)   # abc:123
    print(str1*3)       # 'abcabcabc'
    
    2) ==, !=
    print('abc' == 'abc')   # True
    print('abc' == 'acb')   # False
    
    3) >, <, >=, <=

    只能两个字符串比较大小 - 从前往后找到第一组不相等的字符,比较它们编码值的大小,谁的编码值大哪个字符串就大
    '0' <= char <= '9' - 判断是否是数字字符
    'a' <= char <= 'z' - 判断是否是小写字母
    'A' <= char <= 'Z' - 判断是否是大写字母
    'a' <= char <= 'z' or 'A' <= char <= 'Z' - 判断是否是字母
    '\u4e00' <= char <= '\u9fa5' - 判断是否是中文

    print('abc' > 'bc')    # False
    print('abcf' > 'abca')   # True
    print('abcef' > 'aeaaaaaaa')   # False
    
    4) in/ not in

    字符串1 in 字符串2 -> 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

    str3 = 'how are you!'
    print('how' in str3)   # True
    print('h' in str3)  # True
    print('ha' in str3)  # False
    
    5) len, max, min, sorted, str

    字符串转换: 所有的数据都可以转换成字符串, 转换的时候是将数据放在引号中

    str3 = 'how are you!'
    print(len(str3))    # 12
    
    注意: 转义字符串和编码字符的长度都是1
    str3 = '\\how are\tyou!'
    print(len(str3))   # 13
    
    str3 = '\u4effhow are\tyou!'
    print(len(str3))   # 13
    
    str3 = 'how are you!'
    print(max(str3))   # y
    
    print(sorted(str3))   # [' ', ' ', '!', 'a', 'e', 'h', 'o', 'o', 'r', 'u', 'w', 'y']
    
    6) r语法

    在字符串的最前面加r或R,可以阻止字符串中所有的转义字符转义

    str1 = '\thow\nare\'you!\u4e00'
    print(str1, len(str1))
    
    str1 = R'\thow\nare\'you!\u4e00'
    print(str1, len(str1))
    
    7) 格式字符串

    在字符串中用格式占位符表示字符串中不确定的部分
    a.语法: 包含格式占位符的字符 % (数据1, 数据2,...) - ()中数据的个数和类型要和前面格式占位符一一对应

    b.格式占位符
    %s - 字符串
    %d - 整数
    %.Nf - 浮点数,N控制小数点后小数的位数
    %c - 字符(可以将数字转换成字符)
    注意: 1)所有的数据都可以使用%s来做个数占位符 2)所有的数据都可以使用%s来接收

     name = input('请输入姓名:')
     age = int(input('请输入年龄:'))
     gender = input('请输入性别:')
    #  xx今年xx岁,性别:X!
     message = name+'今年'+str(age)+'岁,性别:' + gender + '!'
     message2 = '%s今年%d岁,性别:%s!' % (name, age, gender)
     print(message)
     print(message2)
    
    str4 = 'a: %s, b:%d, c:%f, d:%.2f e:%c' % ('HOW', 100, 1.23456, 1.23456, 'A')
    print(str4)
    
    str4 = 'a: %s, b:%d, c:%f, d:%.2f e:%c' % ('HOW', 100, 1.23456, 1.23456, 97)
    print(str4)
    
    str4 = 'a: %s, b:%s, c:%s, d:%s e:%s' % ('HOW', 100, 1.23456, 1.23456, 97)
    print(str4)
    

    字符串相关方法

    1.对齐方式

    字符串.center(宽度, 填充字符=' ') - 居中
    字符串.ljust(宽度, 填充字符=' ') - 左对齐
    字符串.rjust(宽度, 填充字符=' ')
    字符串.zfill(宽度) == 字符串.rjust(宽度, 0)

    str1 = 'abc'
    print(str1.center(9, '+'))    # +++abc+++, 居中
    print(str1.ljust(9, '+'))     # abc++++++, 左对齐
    print(str1.rjust(9, '+'))     # ++++++abc, 右对齐
    print(str1.zfill(9))          # 000000abc
    
    # 001, 002, 003, ..., 010, 100
    num = 12    # 012
    num = 9     # 009
    print(str(num).zfill(3))
    

    2.统计子串的个数

    字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数

    str1 = 'how are you! Im fine, thank you! and you?'
    print(str1.count('you'))    # 3
    print(str1.count('h'))     # 2
    print(str1.count('you', 0, 12))  # 在下标是[0, 12)范围内统计'you'的个数
    

    3.获取子串下标

    print(str1.find('you'))   # 8
    print(str1.index('you'))  # 8
    print(str1.find('you1'))   # -1
     print(str1.index('you1'))  # ValueError: substring not found
    

    4.join方法

    字符串.join(序列) - 将序列中的元素用字符串连接产生一个新的字符串
    要求序列中的元素必须是字符串, 如果是字典key是字符串

    new_str1 = '+'.join('123')
    print(new_str1)   # '1+2+3'
    
    new_str1 = 'and'.join(['小明', '小花', '小红'])
    print(new_str1)   # 小明and小花and小红
    
    new_str1 = '-'.join({'name': '小明', 'age': 18,'gender': 'boy'})
    print(new_str1)   # name-age-gender
    
    new_str1 = '+'.join([1, 2, 3])   # TypeError: sequence item 0: expected str instance, int found
    print(new_str1)
    

    5.替换

    字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3
    字符串1.replace(字符串2, 字符串3, N) - 将字符串1中前N个字符串2替换成字符串3

    str1 = 'how are you! Im fine, thank you! and you?'
    new_str1 = str1.replace('you', 'YOU')  # how are YOU! Im fine, thank YOU! and YOU?
    print(new_str1)
    new_str1 = str1.replace('you', 'me', 2)  # how are me! Im fine, thank me! and you?
    print(new_str1)
    

    6.字符串切割

    字符串1.split(字符串2) - 将字符串2作为切割点切割字符串1, 返回一个列表

    str1 = 'how are you! Im fine, thank you! and you?'
    str_list = str1.split(' ')
    print(str_list)   # ['how', 'are', 'you!', 'Im', 'fine,', 'thank', 'you!', 'and', 'you?']
    str_list = str1.split('!')
    print(str_list)  # ['how are you', ' Im fine, thank you', ' and you?']
    

    相关文章

      网友评论

          本文标题:Day8-字符串

          本文链接:https://www.haomeiwen.com/subject/vlmcdctx.html