美文网首页
【数据分析】通过异常数据找出薅羊毛用户

【数据分析】通过异常数据找出薅羊毛用户

作者: 张格希 | 来源:发表于2019-03-04 23:50 被阅读0次

问题背景

共享单车运营方在早高峰鼓励用户将单车骑回居住社区,希望由此缓解高峰期的单车供应问题,通过比较用户早高峰的锁定活动单车次数,发现大多数用户早高峰锁定单车次数在1次或2次的约为40%,另外约25%的用户早高峰锁定单车数为3次或4次。这两部分的用户已经占据65%的比例。说明一般用户在早高峰可以将共享挡车反向骑行5次以内,按早高峰时段的 7:00-9:00 约 120min 计算,平均每次骑行约 24min 。

找出规律
骑行次数过多,超出合理范围

另外选择10月10日在早高峰骑行50~100次的用户列表观察,通过随机抽样,发现绝大部分用户在个别日期可以出现解锁与锁定上百次的记录。

进一步判断出现了异常用户

解锁与锁定单车的时间差前后在 1min 左右,如果按照规则要求骑出地铁站500米范围来说,根据常识几乎不可能,所以说存在一定比例的薅羊毛用户。

(1)匿名ID:309341,设备制造商Huawei,设备型号Mate7,应用版本2.1,操作系统版本5.1

神奇的用户1

(2)匿名ID:309431,设备制造商Sumsung,设备型号Galaxy S6,操作系统版本5.1

神奇的用户2

(3)匿名ID:309889,设备型号iPhone5s,设备制造商Apple,操作系统版本8.1,应用版本2.1

神奇的用户3
提出假设

猜测用户通过将定位随意篡改,以便于让系统误判为参与[众骑]活动成功,发放红包。通过匿名ID为309341的用户可以解锁三个单车判断,用户可能会在单车聚集的地方操作或是收集单车二维码的图片进行操作。

验证假设

通过根据解锁活动单车的人均次数排列,根据解锁方式为扫码,设备型号为iPhone5s,操作系统版本为8.1的条件筛选,按用户姓名查看,导出数据表。

以神奇用户3的特征作为筛选条件

将每位用户的解锁次数最高的前10位填充为绿色,发现有一定的规律,在较活跃的14位账号中,每天活跃的用户数量基本介于5-7人,且有类似错开日期活跃的迹象,可能是一个用户在多个账号来回切换。

神奇用户3的作案时间分布

通过根据解锁活动单车的人均次数排列,根据解锁方式为扫码,设备型号为Galaxy S6,操作系统版本为5.1的条件筛选,按用户姓名查看,导出数据表,将每位用户的解锁次数最高的前10位填充为粉红色。

以神奇用户2的特征作为筛选条件 神奇用户2的作案时间分布

通过根据解锁活动单车的人均次数排列,根据解锁方式为扫码,设备型号为Mate7,操作系统版本为5.1的条件筛选,按用户姓名查看,导出数据表,将每位用户的解锁次数最高的前10位填充为黄色。

以神奇用户1的特征作为筛选条件 神奇用户1的作案时间分布

将两两表格重叠,调整透明度,得到以下3张图

神奇用户2与用户3的作案时间对比 神奇用户1与用户3的作案时间对比 神奇用户1与用户2的作案时间对比
结论:发现有不少相互补充的色块区域,我们可以猜测是团伙作战,否则很少会有这么奇怪的巧合。
后续处置措施

针对用户个体

  • 为了减少公司损失,我们可以通过对比没有作弊的用户在正常骑行过程中,需要花费多少时间,将每个红包领取的间隔时间规定不得少于骑行500米的所需时间,如5分钟。
  • 适当延长红包提现的期限,在此期间将作弊用户过滤出来,对他们的账户金额进行冻结,避免更多无用资金浪费。
    根据之前的数据检测,我们发现通过人力参与活动一天之内至多可以获得10次左右的红包,可以设定么个账户每日通过该活动最多获得10个红包,以此降低作弊用户的获取红包上限数量,增加其获利成本。

在战略层面上

  • 对比之下,如果投入产出比不符合预期甚至比雇佣人力搬运单车来得低,需要及时止损,下架该活动。
  • 后期可寻找其他代替活动,先小范围实验,确保利大于弊的情况下再大力推广。

相关文章

  • 【数据分析】通过异常数据找出薅羊毛用户

    问题背景 共享单车运营方在早高峰鼓励用户将单车骑回居住社区,希望由此缓解高峰期的单车供应问题,通过比较用户早高峰的...

  • 创蓝253防薅羊毛---风控系统原理

    通过大数据分析和数据模型来确定手机号码是否为羊毛党。 通俗点说就是:当用户传送一个手机号码时,创蓝253防薅羊毛-...

  • 如何通过数据分析找出羊毛党

    业务背景:某单车推出了「众骑」活动,鼓励有闲暇时间的用户在早高峰期间反向骑行(也就是将车从地铁站骑回居住社区等地)...

  • Python数据挖掘015-电力窃漏电自动识别

    本项目的目标是通过电量异常数据,负荷异常数据,终端报警数据,主站报警,线损异常数据等信息,建立数据分析模型,来实时...

  • 利用数据分析找出羊毛党

    业务背景 共享单车潮汐效应明显,上班高峰期单车大多堆积在地铁站,复用率不高;平台运力有限,难以缓解此趋势。 为解决...

  • 079|数据分析:从原子世界,移民到数字世界

    概念:数据分析 什么叫数据分析?数据分析,是对用户行为的量化分析。很多时候,用户通过问卷调查,和用户访谈表达的都是...

  • 数据异常分析过程

    背景: 数据异常分析是数据分析工作中最常见且重要的分析主题,通过一次次的异常分析来明确造成数据波动的原因,建立日常...

  • 专注数据化营销的圈子,要讲3个数据挖掘案例,送经典营销资料了

    “营销生财”小密圈专注数据化营销,通过数据采集、数据分析、数据挖掘,寻找出营销机会和渠道,为营销建立科学的分析、推...

  • 方向

    业务方向数据分析、数据运营、数据产品监控指标、分析异常、提出建议 如何判断抖音用户量和自然传播拐点 A/B tes...

  • 机票薅羊毛

    特价机票才航空公司最全分析,精准薅羊毛,干货必备!教你如何买到特价机票 1.机票购买时间 数据表明提前53天...

网友评论

      本文标题:【数据分析】通过异常数据找出薅羊毛用户

      本文链接:https://www.haomeiwen.com/subject/sbkguqtx.html