删除NaN所在的行: 删除表中全部为NaN的行 df.dropna(axis=0,how='all') 删除表中含...[作者空间]
读取上一步清洗好的数据: 查看重复的行 可以看到都是停车位,看来是有人专门买了一大批的车位来再次出售,当然也可能是...[作者空间]
数据清洗前的准备工作: 粗略看一遍数据,我们大致要做的数据处理有以下几点(使用工具为anaconda和jupyte...[作者空间]
前面我们介绍了张学友歌词的词云制作,不过我们使用的是系统默认的图片形状或者是Word Art里的词云模板,可是有时...[作者空间]
粗略的看一遍所有的歌词和歌曲名称,发现有部分歌曲的重复的(有的是CD版、有的是Live版的),所以我们要先对歌曲进...[作者空间]
第一列是产品名称,第二列是星期数,后面是每周的数据。 现在需要保留每个产品相对应的星期数的数据,后面的就删除。比如...[作者空间]
在前面的文章中,我们总结了一下关于时间日期的简单计算,但是我们发现很多功能都是datetime库提供的,那么pan...[作者空间]
如果我们想知道,n天前或者n天后的日期,可以直接加减么? 如果直接上相距的时间的话会出错: 这个功能要使用date...[作者空间]
有时,我们需要对日期进行简单的运算,这就要使用到了日期运算和转换的函数。 例如: 其中使用pd.to_dateti...[作者空间]
在我们处理报表的时候经常会从excel或者csv中读取数据,也经常将数据保存为excel或者csv进行再加工。 那...[作者空间]
是否大量使用自定义函数是区分编程小白和老手的重要指标。 虽然在处理数据时,使用自定义函数能够大大缩减时间,并且达到...[作者空间]
透视表pivot_table()是非常强大的汇总运算函数。 在SQL语句和excel中透视表也是非常普遍的。 pi...[作者空间]
在数据处理的过程中,经常也要进行简单的运算,如果能够配合函数进行使用就会得到更好的结果。 1、加+, 减-,乘* ...[作者空间]
在使用Excel时,我用的最多函数就是vlookup;在使用SQL查询的时候,我用的最多应该是join;这两个都有...[作者空间]
在获取数据的时候经常会有一些重复的数据,而重复的数据会对统计结果产生影响,也会误导决策人员的决策。 数据源还是使用...[作者空间]
在工作中我们有时候需要将一个excel文件分成多个子文件,这种方法虽然能用筛选或者排序然后复制黏贴进行处理,但是如...[作者空间]
文件的合并这里要用到os库的walk和path功能。 例如我们现在有这几个文件,现在想要将它们合并(纵向合并)成一...[作者空间]
有时候我们需要修改DataFrame的个别列名或者索引,避免重复、方便使用。 这时就需要使用到rename()函数...[作者空间]
在数据集里面的缺失值需要填充起来,避免各种出错。 fillna可以指定数值进行填充,也可以使用计算公式进行填充,比...[作者空间]
现有一个现成的表格,是从EXCEL中读取出来的,已经带有序号这一列,我们需要将序号这一列改为索引,这就需要用到se...[作者空间]