今天在弄电话号码清洗后,做分组处理,然后把原来的 电话名称存成一个数组,或是一个列表。
具体用法:
data1 = data[['name', 'phone']].groupby('phone_clear').agg(lambda x: x.str.cat(sep=',')).reset_index()
如果还想把之前生成的数组,再生成不重复的集合,用如下语句即可。
data1['name_set'] = data1['name'].apply(lambda x: set(x.split(',')))
这样即可。
网友评论