美文网首页
序列类型-字符串操作

序列类型-字符串操作

作者: 风清云淡Python | 来源:发表于2018-11-09 13:07 被阅读0次
    序列类型共同的运算及函数.png

    字符串是一个任意Unicode字符序列,包括中文等。可以用三种定界符:单引号、双引号、三引号,但是字符串的首末都得用一样的定界符,如:″ABout″,′123′。三引号用于表示跨行的字符串,如程序的跨行注释。
    要访问字符串中单独的某个字符,用这个字符在字符串中的位置(索引),即这个字符离首字符的偏移量,注意首字符的位置为0,运算采用方括号[],方括号中表达式即为索引,也称为下标。字符串的索引有两种方式:一种是从0开始,向右依次递增序号,另一种是从-1开始,向左依次递减序号,如图1所示。因此访问字符′A′的可用反向递减的索引方式:ft[-5]


    字符串索引方式

    如果要访问字符串中的一个子串,则可以采用区间访问的方式,也可称为分片操作:[M:N],其中M和N为字符串的索引号,表示从M到N(不包括N)的子串,可以采用混合的索引方式,即一个使用递增的索引顺序,另一个采用递减的索引顺序。如果缺省M或N,则分别默认为字符串的开始或结尾的索引号。
    字符串(str)是一个类,封装了一系列的方法来处理更为复杂的文本处理任务的函数,这些封装在类中的函数称为方法,所以说方法就是和特定对象相关联的函数。对于方法的调用方式是:a.b(),表示调用对象a的方法b()。每个字符串均是一个对象,表2列出了部分常用的字符串方法。


    字符串方法

    *注:字符串可以有列表的下标访问str[0],以及切片str[1:3]、反转str[::-1]

    字符串的拼接

    Python使用+来合并两个字符串,这种合并字符串的方法叫做拼接。其基本语法如下:

    result_string = source_string1 + source_string2
    

    其中,

    • source_string1为待合并的第一个字符串
    • source_string2为待合并的第二个字符串
    • result_string为合并后的字符串
    # coding=utf-8
    # 将姓氏和名字分别保存在两个变量中
    first_name = 'Zhang'
    last_name = 'san'
    # 将姓氏和名字拼接,将结果存储在full_name变量中
    full_name = first_name + " " + last_name
    print(full_name)
    

    输出结果: Zhang san

    [字符串长度获取]、 [大小写转换]、[去除字符串首尾空格]

    Python标准库提供了一系列关于字符串处理的函数。本关的小目标是让读者学习并掌握Python常用字符串方法中的len()lower()strip()函数的用法并完成相应字符串处理任务。

    求字符串的长度

    Python提供了len()函数来计算并返回字符串的长度,即字符串中单个元素的个数。其基本语法如下:

    length = len(target_string)

    大小写转换

    Python提供了upper()lower()方法来对字符串进行大小写转换。其中,upper()会将字符串中的所有字符都转换为大写,lower()则将所有字符转换为小写。

    除此之外,Python还贴心的提供了title()方法将字符串所有单词的首字母变成大写,而其他字母依然小写

    # 将源字符串转换为大写并存入upper_string变量
    upper_string = source_string.upper()
    # 将源字符串转换为小写并存入lower_string变量
    lower_string = source_string.lower()
    # 将源字符串每个词首字母转换为大写并存入title_string变量
    title_string = source_string.title()
    

    • 注意: 由上述打印结果可以看出,上述方法的调用并不会对原始的say_hello字符串产生影响,转换后的字符串会存入新的变量中.

    去除字符串首尾空格

    蟒了提供strip()方法,可以去除字符串两侧(不包含内部)全部的空格;使用该方法,也可以通过指定参数,去除两侧指定的特定字符

    • 注意:在指定参数时,如果参数是多个字符,则该方法会将多个字符逐个去比对进行删除(区分大小写),直到首尾两侧没有匹配的字符为止但是,该方法对字符串中间的字符没有影响。

    其基本语法如下:

    strip_string1 = source_string.strip()
    string_strip2 = source_string.strip(target_char)
    

    其中,

    • source_string:待处理的源字符串
    • strip_string1和strip_string2:处理后的字符串
    • target_char:需要从源字符串首尾去除的特定字符
      具体使用示例如下:
    # coding = utf-8
    # 创建一个字符串hello_world
    hello_world = '  **The world ** is big!*    '
    # 利用strip()方法处理hello_world字符串
    blank_hello_world = hello_world.strip()
    char_hello_world = hello_world.strip('TH *')
    # 打印输出转换后的字符串
    print(blank_hello_world)
    print(char_hello_world)
    

    输出结果:
    **The world ** is big!*
    he world ** is big!
    输出结果分析:

    • 从第一行打印结果可以看到,strip()方法去除了源字符串首尾的所有空格,但是并没有去除字符串中间的空格
    • 从第二行打印结构可以看出,strip()方法将源字符串首尾所有空格,*以及字符T。去掉了。而字符串源中头部的h因为的英文小写并没有去除

    字符串查找

    Python中提供了内置的字符串查找方法find(),利用该方法可以在一个较长的字符串中查找子字符串。如果该字符串中有一个或者多个子字符串,则该方法返回第一个子串所在位置的最左端索引;若没有找到符合条件的子串,则返回-1。
    find()方法的基本使用语法如下:

    source_string.find(sub_string)
    

    其中,

    • source_string:源字符串
    • sub_string:待查的目标子字符串
    • find:字符串查找方法的语法关键字
      例如,在一个字符串中查找两个单词的位置:
    # coding=utf-8
    # 创建一个字符串
    source_string = 'The past is gone and static'
    # 查看"past"在source_string字符串中的位置
    print(source_string.find('past'))
    # 查看"love"在source_string字符串中的位置
    print(source_string.find('love'))
    

    输出结果:
    4
    -1

    index()方法:

    python 的index方法是在字符串里查找子串第一次出现的位置,类似字符串的find方法,不过比find方法更好的是,如果查找不到子串,会抛出异常,而不是返回-1

    info = 'abca'
    print info.index('a')
    print info.index('33')
    

    rfindrindex方法用法和上面一样,只是从字符串的末尾开始查找。

    字符串替换

    蟒蛇了提供replace()方法,用以替换给定字符串中的子串,其基本使用语法如下:

    source_string.replace(old_string, new_string)
    

    其中,

    • source_string:待处理的源字符串
    • old_string:被替换的旧字符串
    • new_string:替换的新字符串
    • replace:字符串替换方法的语法关键词
      例如,如下在字符串中用small子串替换big子串
    # coding = utf-8
    # 创建一个字符串circle
    source_string = 'The world is big'
    # 利用replace()方法用子串"small"代替子串"big"
    print(source_string.replace('big','small'))
    

    输出结果:
    The world is small

    字符串分割

    蟒了提供split()方法实现字符串分割。该方法根据提供的分隔符将一个字符串分割为字符列表,如果不提供分隔符则程序会默认把空格(制表,换行等)作为分隔符。其基本使用语法如下:

    source_string.split(separator)
    

    其中,

    • source_string:待处理的源字符串
    • separator:分隔符
    • split:字符串分割方法的关键词
      例如,用+,/还有空格作为分隔符分割字符串。
    # coding = utf-8
    # 待处理字符串source_string
    source_string = '1+2+3+4+5'
    # 利用split()方法,按照`+`和`/`对source_string字符串进行分割
    print(source_string.split('+'))
    print(source_string.split('/'))
    

    输出结果:
    ['1', '2', '3', '4', '5']
    ['1+2+3+4+5']

    count()方法

    Python count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。
    语法
    count()方法语法:

    str.count(sub, start= 0,end=len(string))
    

    参数

    • sub -- 搜索的子字符串
    • start -- 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
    • end -- 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

    返回值
    该方法返回子字符串在字符串中出现的次数。
    实例
    以下实例展示了count()方法的实例:

    实例(Python 2.0+)
    #!/usr/bin/python
     
    str = "this is string example....wow!!!";
     
    sub = "I";
    print "str.count(sub, 4, 40) : ", str.count(sub, 4, 40)
    sub = "wow";
    print "str.count(sub) : ", str.count(sub)
    

    以上实例输出结果如下:
    str.count(sub, 4, 40) : 2
    str.count(sub) : 1

    相关文章

      网友评论

          本文标题:序列类型-字符串操作

          本文链接:https://www.haomeiwen.com/subject/azdgxqtx.html