目的:针对pandas下dataframe格式的数据,有一列是字符串格式的,想要对其进行分割。
函数:pandas.Series.str.split
用法:Series.str.split(pat=None, n=- 1, expand=False, *, regex=None)
- pat:字符串或者正则表达式,如果不设置默认为空格
- n:整数,默认为-1,限制输出分割的次数。None, 0和-1将被解释为返回所有拆分。
- expand: 布尔型,默认为False,决定是否将拆分的字符串展开为单独的列。如果为True,返回DataFrame/MultiIndex扩展维度;如果为False,返回包含字符串列表的Series/Index。
-
regex:布尔型,默认为None, 确定传入的模式是否为正则表达式。
想要分割的列
代码:
df['prov_o'] = df['source'].str.split('_', expand=True)[0]
网友评论