美文网首页
数据清洗的犯得错误

数据清洗的犯得错误

作者: HELLOTREE1 | 来源:发表于2018-10-31 12:07 被阅读0次

    在平安实习,一些关于数据分析的:

    用正则表达式分割字符,保留分割字符 的:

    txt=“日期:2018年2月3日 日期:2019年3月2日”

    res=re.split(['日期'],txt)

    Res=res[1:]

    Res=[''.join(i).strip() for i in zip(res[0::2],res[1::2])]


    pandas:找到某值对应的某行:df[df['xx'].isin([value])]


    创建一个空的DataFrame后,往里面添加series,一定要df=df.append(df1),df1进行concat得到,被读取dataframe格式,注意,一定不能有重复字段,会报错!!!!!!!!!

    在进行拼接的时候,两个dateframe concat在一起(axis=1)按照列拼接,但是最后仍然不能显示在一行,试了很多方法均不可行,解决方法:提取前面两个dateframe的values拼接到data,之后给定columns 写入dateframe


    相关文章

      网友评论

          本文标题:数据清洗的犯得错误

          本文链接:https://www.haomeiwen.com/subject/tgyyzftx.html