第5章 - String 字符串

作者: vwFisher | 来源:发表于2019-05-20 22:58 被阅读0次

JAVA（10）字符串处理
2018-10-2
第116章 SQL函数 REPLACE
第134章 SQL函数 STUFF
【通俗易懂C++ STL模板库】容器遍历查找、排序、拷贝、替
Python第二天
程序员面试金典 Chapter1 Arrays and Stri
一些你可能不知道的Python操作
java-为什么String要设计成不可变的?
字符串匹配算法

第5章 - String 字符串

菜鸟教程：https://www.runoob.com/python3/python3-string.html

5.1 基础

字符串是Python中最常用的数据类型。用''，或""来创建字符串。

所有标准的序列操作(如索引、分片、成员资格、求长度、最小值、最大值)对字符串同样适用，但注意字符串是不可变的。所以字符串不能进行分片赋值

str = 'Hello World';
print(str[6:]) # 可以通过分片来获取
str[6:]='Python' # 报错

5.1.1 Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符，如：

para_str = """这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用换行符 [ \n ]。
"""
print (para_str)

5.1.2 Unicode 字符串

在Python2中，普通字符串是以8位ASCII码进行存储的，而Unicode字符串则存储为16位unicode字符串，这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。

在Python3中，所有的字符串都是Unicode字符串。

5.1.3 总结

python中单引号和双引号使用完全相同。
使用三引号('''或""")可以指定一个多行字符串。
转义符 ''
反斜杠可以用来转义，使用r可以让反斜杠不发生转义。。如 r"this is a line with \n" 则\n会显示，并不是换行。
按字面意义级联字符串，如"this " "is " "string"会被自动转换为this is string。
字符串可以用 + 运算符连接在一起，用 * 运算符重复。
Python 中的字符串有两种索引方式，从左往右以 0 开始，从右往左以 -1 开始。
Python中的字符串不能改变。
Python 没有单独的字符类型，一个字符就是长度为 1 的字符串。
字符串的截取的语法格式如下：变量[头下标:尾下标:步长]

代码示例

print('==========[ 字符串 ]==========')
str = 'Hello World'
print(str)                 # 输出字符串
print(str[0:-1])           # 输出第一个到倒数第二个的所有字符
print(str[0])              # 输出字符串第一个字符
print(str[2:5])            # 输出从第三个开始到第五个的字符
print(str[2:5:3])          # 输出从第三个开始到第五个的字符，以3为步长获取
print(str[2:])             # 输出从第三个开始的后的所有字符
print(str * 2)             # 输出字符串两次
print(str + '你好')        # 连接字符串
print('hello\nrunoob')      # 使用反斜杠(\)+n转义特殊字符
print(r'hello\nrunoob')     # 在字符串前面添加一个 r，表示原始字符串，不会发生转义

5.2 转义字符

转义字符	描述	转义字符	描述
\ (在行尾时)	续行符	\n	换行
\\	反斜杠符号	\v	纵向制表符
\'	单引号	\t	横向制表符
\"	双引号	\r	回车
\a	响铃	\f	换页
\b	退格(Backspace)	\oyy	八进制数，yy代表的字符，如\o12代表换行
\c	转义	\xyy	十六进制数，yy代表的字符，如\x0a代表换行
\000	空	\other	其他自负以普通格式输出

5.3 字符串运算符

操作符	描述	实例
+	字符串连接	"Hello" + "Python" => HelloPython
*	重复输出字符串	"Hello" * 2 => HelloHello
[]	通过索引获取字符串中字符	"Hello"[1] => e
[ : ]	截取字符串中的一部分，遵循左闭右开原则，str[0,2] 是不包含第 3 个字符的。	"Hello"[1:4] => ell
in	成员运算符 - 如果字符串中包含给定的字符返回 True	'H' in "Hello" => True
not in	成员运算符 - 如果字符串中不包含给定的字符返回 True	'M' not in "Hello" => True
r/R	原始字符串 - 字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。原始字符串除在字符串的第一个引号前加上字母 r（可以大小写）以外，与普通字符串有着几乎完全相同的语法。	print( r'\n' ) print( R'\n' )
%	格式字符串

代码示例：

print('\n==========[ 字符串运算符 ]==========')
a = "Hello"
b = "Python"
print("a + b 输出结果：", a + b)
print("a * 2 输出结果：", a * 2)
print("a[1] 输出结果：", a[1])
print("a[1:4] 输出结果：", a[1:4])
# print("a[6:] 报错")

if("H" in a):
    print("H 在变量 a 中")
else:
    print("H 不在变量 a 中")

if("M" not in a):
    print("M 不在变量 a 中")
else:
    print("M 在变量 a 中")

print(r'\n')
print(R'\n')

5.4 字符串格式化

使用操作符百分号(%)实现，%也可以作模运算(求余)操作符。%左边放置待格式化字符串，右边放置希望格式化的值，单个值，不需要加()，多个值则需要用元组()，或字典形式，如：

print('%s'%'Hello')
print('%s,%s'%('Hello','World'))

Python提供的格式化符号

符号	描述	符号	描述
%c	格式化字符及其ASCII码	%f	格式化浮点数字，可指定精度值
%s	格式化字符串	%e / %E	用科学计数法格式化浮点数
%d	格式化整数	%g	%f 和 %e 的简写
%u	格式化无符号整型	%G	%f 和 %E 的简写
%o	格式化无符号八进制数	%p	用十六禁止数格式化变量的地址
%x	格式化无符号十六进制数	%X	格式化无符号十六进制数(大写)

格式化操作符辅助指令:

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号( + )
<sp>	在正数前面显示空格
#	在八进制数前面显示零('0')，在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0	显示的数字前面填充'0'而不是默认的空格
%	'%%'输出一个单一的'%'
(var)	映射变量(字典参数)
m.n	m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

如果使用列表或其他序列代替元组，序列就会被解释为一个值。只有元组和字典可以格式化一个以上的值。

说明：

%字符：标记转换说明符开始
转换标志(可选)：- 代表对齐；+ 代表转换值之前要加上正负号；" "(空白字符) 表示正数之前保留空格；0 表示转换值位数不够时用0填充。
最小字段宽度(可选)：转换后的字符串至少应该具有该值指定的宽度。如果是*，宽度就会从元组中读出。%m.nf，m=宽度，n=精度
点(.)后跟精度值(可选)：如果转换的是实数，精度值表示出现在小数点后的位数；如果转换的是字符串，该数字就表示最大字段宽度；如果是*，京都就会从元组中读出
转换类型

示例：

print('\n字段宽度和精度')
print('%10f'%1.2345)   # 宽度10，浮点小数点6位，前面用空格补齐
print('%10.2f'%1.2345) # 宽度10，小数点保留2位，前面用空格补齐
print('%.2f'%1.2345)   # 小数点保留2位，前面用空格补齐
print('%.5s'%'Hello World')   # 打印字符前 5位
print('%*.*f'%(5,2,1.2345)) # *作为占位符，由元组给出值，代表宽度5，小数点2位

print('\n符号、对齐和0填充')
print('%05d'%1)         # 00001; 0填充
print('%010.2f'%1.2345) # 0000001.23
print('%-10.2f'%1.2345) # 1.23      ; -：代表左对齐
print('% 5d'%10)  #    10
print('% 5d'%-10) #   -10
print('% -5d'%10) #  10
print('%+5d'%10)  #   +10
print('%+5d'%-10) #   -10

5.5 字符串内建函数

Python 的字符串常用内建函数如下：

方法	描述
len(string)	返回字符串长度
capitalize()	将字符串的第一个字符转换为大写

| encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串，如果出错默认报一个ValueError 的异常，除非 errors 指定的是'ignore'或者'replace' |
| bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回 |

| startswith(substr, beg=0,end=len(string)) | 检查字符串是否是以指定子字符串 substr 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查 |
| endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False |

| split(str="", num=string.count(str)) | num=string.count(str)) 以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num+1 个子字符串 |
| splitlines([keepends]) | 按照行('\r', '\r\n', \n')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符 |
| join(seq) | 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
| replace(old, new [, max]) | 把将字符串中的 str1 替换成 str2,如果 max 指定，则替换不超过 max 次 |

| maketrans() | 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标 |
| translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |

实例：

print('\n==========[ 字符串内建函数 ]==========')
print("len('Hello') = ", len('Hello'))  # 5
print("'hello'.capitalize() = ", 'hello'.capitalize())  # Hello

print("'Hello'.encode(encoding='UTF-8') = ", 'Hello'.encode(encoding='UTF-8'))  # b'Hello'
print("'Hello'.encode(encoding='UTF-8').decode(encoding='UTF-8', errors='strict') = ", 'Hello'.encode(encoding='UTF-8').decode(encoding='UTF-8', errors='strict'))  # Hello

print("'Hello'.upper() = ", 'Hello'.upper())  # HELLO
print("'Hello'.lower() = ", 'Hello'.lower())  # hello
print("'Hello'.swapcase() = ", 'Hello'.swapcase())  # hELLO

print("'Hello'.startswith('He') = ", 'Hello'.startswith('He'))  # True
print("'Hello'.endswith('llo') = ", 'Hello'.endswith('llo'))  # True

print("'Hello'.find('llo') = ", 'Hello'.find('l'))  # 2，不存在返回 -1
print("'Hello'.rfind('llo') = ", 'Hello'.rfind('l'))  # 3，不存在返回 -1

print("'Hello'.index('l') = ", 'Hello'.index('l'))  # 2，不存在 抛出异常
print("'Hello'.rindex('l') = ", 'Hello'.rindex('l'))  # 3，不存在 抛出异常

print("'Hello'.count('l') = ", 'Hello'.count('l'))  # 2
print("'He\tllo'.expandtabs(8) = ", 'He\tllo'.expandtabs(8))  # He      llo

print("' Hello '.strip() = ", ' Hello '.strip())  # Hello
print("' Hello '.lstrip() = ", ' Hello '.lstrip())  # Hello
print("' Hello '.rstrip() = ", ' Hello '.rstrip())  #  Hello

print("'Hello'.center(10, '*') = ", 'Hello'.center(10, '*'))  # **Hello***
print("'Hello'.ljust(10, '*') = ", 'Hello'.ljust(10, '*'))  # Hello*****
print("'Hello'.rjust(10, '*') = ", 'Hello'.rjust(10, '*'))  # *****Hello


print("'Hello'.islower() = ", 'Hello'.islower())  # False
print("'HELLO'.isupper() = ", 'HELLO'.isupper())  # True
print("'  '.isspace() = ", '  '.isspace())  # True
print("'12345'.isnumeric() = ", '12345'.isnumeric())  # True
print("'Hello'.isalnum() = ", 'Hello'.isalnum())  # True
print("'Hello'.isalpha() = ", 'Hello'.isalpha())  # True
print("'123'.isdigit() = ", '123'.isdigit())  # True
print("'Hello World'.istitle() = ", 'Hello World'.istitle())  # True
print("u'23443434'.isdecimal() = ", u'23443434'.isdecimal())  # True

print("'Hello World'.split(' ') = ", 'Hello World'.split(' '))  # ['Hello', 'World']
print("'Hello\rrr\nnn\r\nrn'.splitlines() = ", 'Hello\rrr\nnn\r\nrn'.splitlines())  # ['Hello', 'rr', 'nn', 'rn']
print("' '.join(['Hello', 'World']) = ", ' '.join(['Hello', 'World']))  # Hello World
print("'Hello'.replace('llo', 'y') = ", 'Hello'.replace('llo', 'y'))  # Hey

print("max('Hello') = ", max('Hello'))  # o
print("min('Hello') = ", min('Hello'))  # H

print("'Hello'.zfill(8) = ", 'Hello'.zfill(8))  #  000Hello
print("'HELLO WORLD'.title() = ", 'HELLO WORLD'.title())  # Hello World

print("\n maketrans and translate")
intab = "aeiou"
outtab = "12345"
trantab = str.maketrans(intab, outtab)   # 制作翻译表

str = "this is string example....wow!!!"
print (str.translate(trantab))

JAVA（10）字符串处理
字符串处理定义字符串使用String; String str = "hello"; String str; ...
2018-10-2
字符串 String类一.声明字符串String a；二.创建字符串引用字符串常量String a="我是谁"...
第116章 SQL函数 REPLACE
第116章 SQL函数 REPLACE 字符串函数，用于替换字符串中的子字符串。大纲参数 string - 作...
第134章 SQL函数 STUFF
第134章 SQL函数 STUFF 字符串函数，用于替换字符串中的子字符串。大纲参数 string - 作为子...
【通俗易懂C++ STL模板库】容器遍历查找、排序、拷贝、替
String 概念 string 是 STL的字符串类型，通常用来表示字符串。而在使用 string 之前，字符串...
Python第二天
[DOT] while循环：字符串: 字符串定义：string=' '或者string=(' ') 其中字符串的...
程序员面试金典 Chapter1 Arrays and Stri
第一题翻转字符串把一个给定的字符串反转笨方法，遍历整个给定的string，将数组string[n]中的第i个...
一些你可能不知道的Python操作
字符串转列表(string to list) 列表转字符串(list to string)
java-为什么String要设计成不可变的?
1 字符串常量池的需要字符串常量池(String pool,String intern pool, String...
字符串匹配算法
拉勾教育中《重学数据结构与算法》第08节讲到，字符串和如何应对字符串匹配算法。字符串字符串（string）是...

第5章 - String 字符串

第5章 - String 字符串

5.1 基础

5.1.1 Python三引号

5.1.2 Unicode 字符串

5.1.3 总结

代码示例

5.2 转义字符

5.3 字符串运算符

5.4 字符串格式化

5.5 字符串内建函数

相关文章

JAVA（10）字符串处理

2018-10-2

第116章 SQL函数 REPLACE

第134章 SQL函数 STUFF

【通俗易懂C++ STL模板库】容器遍历查找、排序、拷贝、替

Python第二天

程序员面试金典 Chapter1 Arrays and Stri

一些你可能不知道的Python操作

java-为什么String要设计成不可变的?

字符串匹配算法

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读