一、反垃圾策略的应用场景
在社区类产品中经常会出现很多垃圾内容,常见的垃圾内容有色情信息、外链引流信息等。由于此类垃圾信息通常都是批量生成,因此人工删除速度远远跟不上垃圾信息的产生速度,铺天盖地的垃圾信息对于社区氛围、用户体验都是极其不利的,甚至还会存在法律法规上的风险。因此在产品策略角度考虑反垃圾设计是非常重要的。
二、垃圾信息的特征与分析
分析垃圾信息,不难发现以下几点特征:
1.这些信息内容上大同小异,同时基本附有手机、微信、qq、外链等;
2.发布者帐号多为新注册的帐号,极少数为正常用户;
3.发布者IP地址与MAC地址均不一致。
由此分析垃圾信息的产生存在以下共性:
1.发布者目的是希望将用户向站外引流,与社区本身不构成竞争关系;
2.发布者多为恶意批量注册的帐号,且无法禁用IP/MAC地址来屏蔽。
三、如何解决上述问题?
首先来看垃圾信息的产生流程,恶意批量注册——>垃圾信息发布,因此我们考虑从这两个环节中防御垃圾信息的产生。
1.帐号体系
首先是帐号体系设计,我们的主要目的是限制注册以及登录这两个环节,以下分别阐述:
1)注册限制
- 新用户注册时,通过增加验证码以此增加注册成本,如图片验证码、短信验证码等,由此防止恶意的批量注册;
- 收集注册数据,对比正常用户行为,对非正常帐号进行冻结;
2)登录限制
- 用户登陆时,增加验证方式,如图片验证、人机识别验证等;
- 限制用户登录频次;
- 高危帐号(多次异地登录)校验、强制更改密码等
2.内容发布
发布限制
- 用户发布内容时,增加图片验证、人机识别混合验证;
- 关键字校验,触及违规或敏感词不允许发出;
- 限制新用户的日发布内容数量;
四、上述方案存在的缺陷
增加了上述限制后,同样会产生一些缺陷,以下简要描述:
- 验证方式复杂,造成用户注册、登录、内容发布流程受阻,由此导致新增用户、活跃用户、内容产生量降低;
- 垃圾信息发布者为了突破帐号限制,甚至会盗取老用户帐号以达到发布垃圾信息的目的;
- 增加关键词滞后,只有等垃圾信息积累到一定数据才会添加至关键词库,此时垃圾内容已经产生;
- 关键词采取一刀切的策略,容易造成信息的误过滤,由此也打击了用户的积极性。
五、解决方案2.0
针对上述缺陷,我们采取更加细粒度的限制手段,
对于验证码:
- 增加每日免验发布阈值;
- 对于活跃用户给予免验特权;
- 更换更加简单的验证方式:行为验证代替图片验证。
对于关键词过滤:
- 关键词划分等级,分等级处理,低等级关键词用**代替,中等级关此间仅发布者可见,其他用户不可见,高等级关键词直接无法发布;
- 建立内容过滤次,对已屏蔽的内容进行记录,若出现正常内容被过滤的情况,可手动恢复;
- 增加新关键词后,支持将历史内容重新过滤一次。
一些思考
1.一些技术问题,从产品角度也能给出相应的解决策略;
2.数据监控的重要性;
3.分析问题时,学会从问题的关键节点考虑,提取共性和发现差异;
4.问题的解决方案需要不断调整,从用户角度、产品角度进行逐步迭代,得出局部最优解;
5.学会深入业务思考问题,分析业务,找到利益矛盾点,对解决问题大有裨益。
实用服务:
极验http://www.geetest.com/
网易易盾http://dun.163.com/
参考文章:
本文是对Web 社区产品那点事儿 —— 垃圾帖与产品安全策略的整理,侵删
网友评论