刘慈欣写过一个短篇科幻小说叫<镜子>, 对我而言其冲击力不亚于<三体>。
主人公白冰是一个学数学的码农,有一天突发奇想尝试对宏观世界创建数学模型实现镜像模拟,从宇宙大爆炸的奇点开始设置参数模拟宇宙的诞生,创造的无数个平行世界中有一个对我们的世界实现了百分百的再现,因为他具备了上帝视角,对过去发生的,正在发生的,甚至未来将要发生的一切都了如指掌。
image.png相对于对整个世界在原子级进行建模而言,零售行业的场景要简单很多,只是很少人通过数据驱动的方式来进行决策的优化,又或者完全依赖人工分析的单线程迭代的方式过慢。而机器学习可以将进化速度提升几个数量级别,我们可以同时创建很多个平行世界,通过模拟计算的实时反馈不断调整参数来逼近最优解。
做机器学习的人往往沉迷于算法,缺少对业务的深刻理解和发现应用场景的敏锐,业务线的人则更难理解什么是机器学习,能对自己在哪些方面带来什么样的帮助,两者之间的鸿沟,更甚于需求方与码农之间的沟通障碍,而且后者还有个产品经理的角色来充当桥梁。
image.png找到应用场景之后的挑战是如何设定衡量目标,可量化指标是迭代优化的方向,是评判平行世界是否符合预期的标准,通常我们会用打分的形式来设定这个标准,但是决定评分的高低会有各种不同维度的因素组合,这些维度又有不同的权重,问题在于如何找到合理的维度并设置合理的相应权重。这就是对训练数据的标注,在我看来也是最棘手的问题。
最后需要考虑的是如何模拟平行世界,找到关键因子来建模,基于对业务场景的理解找出有可能影响这个世界演变的维度,获取这些维度依赖的数据,构建出模拟世界的模型计算出关键因子的权重。
image.png
如上图所示,寻找应用场景就是计划部分的目标设定,在执行阶段则收集数据,提取并处理特征,然后创建模型,根据评估标准不断进行优化迭代。
下面我会先列举出我看到的零售行业的部分应用场景,并挑选一个场景加以说明,毕竟前面的描述可能有些抽象。
- 渠道端场景
渠道端指的是销售渠道,包括了线下门店和线上商城,可以围绕人货场三要素来展开。
1.1 门店选址
选址决定门店的先天基因,运营决定门店的后天成长,基因好就开了个好头,之后的运营可以事半功倍。选址关注两个点,一个是已知的租金,租金是经营成本的大头; 一个是未知的客流,客流是决定销售的最关键因素。
客流又是由宏观选址的外围因素和微观选址的内在因素来决定的,拿到了这些数据就能够建立模型对未知客流实现预测。这正是目前我们在研发过程中的一个项目,细节会在后面展开说明。
1.2 用户生命周期
用户的生命周期从新客获取到二次复购到活跃用户到沉睡或者流失,每个阶段都有一个关键时间节点是营销的最佳时机。如果能实现周期中状态转变的预测,就能将精准营销的ROI最大化,这里要解决的问题是对谁在什么时间通过什么渠道发送什么样的消息,有的人营销了也不来,有的人不营销也会来,我们关注的是那些营销了才来的用户。这个场景的预测是已经验证过可行性的,我们做到了针对90%的用户的状态转变预测准确率达到95%, 除了RFM维度还发现了一些其他的关键因子。
image.png
1.3 定价策略
商品的价格和销量有一个价格弹性曲线,价格和销量是负相关的,销量对价格是否敏感决定了调价后总销售额的走向,结合毛利率则会决定总利润的走向。有两种方式可以尝试,一个是内部商品做变价AB测试,另一个是爬取外部商品数据在不同价格带的销量来预测。
image.png
1.4 促销策略
促销也是一种变价方式,但是玩法及其丰富,促销类型包括满减,折扣,特价,加价购等,其中满减又可以衍生出很多种不同类型,不同用户对不同促销类型的敏感度是不一样的,对促销的门槛和幅度的接受度也不一样,如何找出规律进而预测出给什么用户看什么促销能将转化最大化也可以是一个精细化运营的研究方向。
1.4 推荐算法
这是最常见最成熟的应用场景,都不用再描述了。
1.5 内容生成
从标题自动化生成,图片自动化生成,到最近珠玑实现的全文自动化生成。
第一个阶段是自动化生成,目标是节省人力成本。
第二个阶段是赛马,胜出的素材自动化全量
第三个阶段是千人千面,结合个性化结合用户的偏好生成多套不同的内容。
- 供应端场景
供应端指供应链的全链条,包括企划环节,生产环节和配发环节。
2.1 品类规划
2.2 商品企划
2.3 产品企划
2.4 智能配发
网友评论