pandas正则

作者: Jlan | 来源:发表于2019-01-24 10:02 被阅读7次
    df = pd.DataFrame(np.array([[1,2,3],[2,3,4],[3,4,5]]),columns=['a','d1','d2'])
    
       a  d1  d2
    0  1  2   3
    1  2  3   4
    2  3  4   5
    

    filter

    filter使用正则过滤以“d”开头的列

    df.filter(regex=("d.*"))
    
       d1  d2
    0  2   3
    1  3   4
    2  4   5
    

    select

    除了使用filter的正则外,也可以使用select来选择以“d”开头的列:

    df.select(lambda col: col.startswith('d'), axis=1)
    
       d1  d2
    0  2   3
    1  3   4
    2  4   5
    

    extract

    df[['室', '厅', '厨', '卫']] = df['户型'].str.extract('(\d+)室(\d+)厅(\d+)厨(\d+)卫', expand=False)
    

    相关文章

      网友评论

        本文标题:pandas正则

        本文链接:https://www.haomeiwen.com/subject/jqdrjqtx.html