美文网首页
2020-12-30计算重复数据

2020-12-30计算重复数据

作者: 地球上有个王家庄 | 来源:发表于2020-12-30 20:53 被阅读0次

一般来说我们重复数据的计算是直接去重就好
目前遇到一个问题,我们把上报时间在相差1min以内,且其他参数都相同的记录作为重复记录看代
如何判断呢,需要用到函数LEAD

# [SQL LEAD()函数 LAG()函数](https://www.cnblogs.com/jasonlai2016/p/10166842.html
lag ,lead 分别是向前,向后;
lag 和lead 有三个参数,第一个参数是列名,第二个参数是偏移的offset,第三个参数是 超出记录窗口时的默认值)
LEAD ( scalar_expression [ ,offset ] , [ default ] )     OVER ( [ partition_by_clause ] order_by_clause )
SELECT COUNT(1) AS repeat_num
  FROM (
        SELECT imei
               ,params
               ,event_time
               ,event_time_compare
          FROM (
                SELECT imei
                       ,params
                       ,event_time
                       ,lead(event_time,1) OVER(PARTITION BY imei,map_to_string(params) ORDER BY event_time ASC) AS event_time_compare
               from tabel
               where day = '2020-12-28'
               and hour = 3
               )tmp0
         WHERE ABS(event_time-event_time_compare)<1000
       )tmp1

相关文章

  • 2020-12-30计算重复数据

    一般来说我们重复数据的计算是直接去重就好目前遇到一个问题,我们把上报时间在相差1min以内,且其他参数都相同的记录...

  • Power Pivot中如何计算文本的非重复计数?

    计算文本的非重复计数 原数据 需求:计算快递单号的非重复计数 (一) 需求分析 如果要计算非重复计数,我们很容易可...

  • Unity海洋shader笔记②

    笔记①提到,要计算泡沫数据需要临近顶点的位移数据,因此为了避免重复计算顶点位移我们需要在正式渲染水面之前就先计算好...

  • EXCLE数据处理学习大全,学会这些就够了!

    1、数据拆分 2、数据合并 3、缺失数据处理 4、重复数据处理 5、数据分组 6、数据标准化 7、加权计算 8、数...

  • HyperLogLog:海量数据下的基数计算

    1. 什么是基数计算 基数计算(cardinality counting)指的是统计一批数据中的不重复元素的个数,...

  • excel的几种功能

    一键汇总:alt键➕等号键 删除重复记录:只有10版有删除重复项 重复计数:数据中合并计算,计数,(日期的格式如何...

  • 数据处理方法简介

    数据清洗 重复数据的处理: 函数法:COUNTIF(单元格范围,计算条件) 高级筛选法:数据选项卡 - 排序和筛选...

  • 函数

    Python set() 函数set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交...

  • 计算稿录完数据,鼠标双击瞬间完成格式设置、自动汇总——后期处理篇

    当计算稿完成录入数据,计算稿是这样子 目标计算稿 如果手工操作,那可是大量不停重复的“选中单元格”——“合并单元格...

  • python set()函数

    set()函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。

网友评论

      本文标题:2020-12-30计算重复数据

      本文链接:https://www.haomeiwen.com/subject/fbhkoktx.html