美文网首页
MongoDB删除重复数据

MongoDB删除重复数据

作者: thepoy | 来源:发表于2020-04-01 12:48 被阅读0次

在爬一些网页时,由于翻页后可能会有前一页的部分数据因点击或成交等因素又被排到了当前页,这样会造成数据的重复,删除数据可以用驱动写个小程序解决(比如python用pymongo)。最简单有效的方式还是用mongo命令解决:

db.collection(目标文档).aggregate([
    {
        $group:{_id:{url:'$url'(筛选条件,可以用多个字段)},count:{$sum:1},dups:{$addToSet:'$_id'}}
    },
    {
        $match:{count: {$gt:1}}
    }
]).forEach(function(it){
    it.dups.shift();  /* dups是重复数组,shift()删除重复数组dubps里的的第一条数据,防止全部删除
    db.wwz.remove({_id: {$in: it.dups}});
})

相关文章

  • Mongodb 删除重复数据

    1.根据userName和age分组并统计数量,$group只会返回参与分组的字段,使用$addToSet在返回结...

  • MongoDB删除重复数据

    在爬一些网页时,由于翻页后可能会有前一页的部分数据因点击或成交等因素又被排到了当前页,这样会造成数据的重复,删除数...

  • MongoDB删除重复数据

    使用MongoDB存储爬取到信息,但是由于考虑不周,没有对重复的数据进行去重后才插入数据库,导致有很多重复的数据,...

  • Mongodb基本操作

    mongodb数据库管理: Mongodb插入文档: Mongodb更新文档 Mongodb删除文档: Mongo...

  • mongoDB删除重复的数据 去重

    最近在工作上遇到需要清理鸡汤文中重复的数据,网上搜了一下,有不少方案,有用程序去重的,有用唯一索引来控制的,感觉都...

  • Node.js官方mongodb驱动

    准备 一些mongodb命令 连接mongodb 插入数据 更新数据 删除数据 查询数据 参考https://gi...

  • sql 操作

    删除重复的数据 查询重复的数据

  • MongoDB基本操作命令

    MongoDB数据类型 MongoDB创建/删除数据库 use DATABASE_NAME 如果数据库不存在,创...

  • 记录几个好用的SQL

    删除重复 重复数据: 得到结果:

  • mongodb和mongoose

    mongodb 更新数据的方法 删除一个子集

网友评论

      本文标题:MongoDB删除重复数据

      本文链接:https://www.haomeiwen.com/subject/priouhtx.html