美文网首页Hase我爱编程
Hbase如何设计Rowkey

Hbase如何设计Rowkey

作者: 明明德撩码 | 来源:发表于2018-05-11 16:32 被阅读99次

    分析【话单数据分析】项目需求

    用户需要进行实时的查询,那么这些数据是放在HBase当中的,每个客户每天接打电话至少20个左右,而通信公司拥有很多用户,每天产生的数据都是上亿条。

    分析【话单数据分析】项目需求

    分析上图得到以下结果:
    上图中总通话127次,是查询在时间范围内的所有通话记录,可用count统计总数;日均9次:总数/天数;
    累计约4时16分:累加在时间范围内的通话时间;日均9分钟:总通话时间/天数

    分析【话单数据分析】项目需求

    常联系的小伙伴功能中包含前10位常被联系的人,和前10位主动联系的人。并且各人都统计了次数。


    分析【话单数据分析】项目需求

    统计出通话次数最多的一天是4月3日


    分析【话单数据分析】项目需求

    • 分析上面的功能需求,提取出需要的信息,主要包括以下几点:
      自己的号码:telphone
      拨打或接听时间:teltime
      区域:area
      主叫或被叫:active
      对方的号码:phone
      通话时长:talktime
      通话模式(国内或国外):mode
      费用:price
    • 而大部分功能的查询条件分析如下:
      telphone +(starttime - endtime),条件是:号码+开始时间——结束时间

    设计Rowkey

    • 条件在上一章提过:号码+开始时间——结束时间,那么设计Rowkey就是telphone(电话号码)+teltime(通话时间)
      在表的Rowkey设计中:
    • 核心思想:
      • 依据Rowkey查询最快
      • 在实际的应用当中,就是对Rowkey进行范围查询range,Rowkey通常都是多个字段组成的。
      • Rowkey是前缀匹配的


    相关文章

      网友评论

        本文标题:Hbase如何设计Rowkey

        本文链接:https://www.haomeiwen.com/subject/hbgfdftx.html