美文网首页
【技术·分享】优化算法为理性决策赋能系列之二:柜机规格最优推荐

【技术·分享】优化算法为理性决策赋能系列之二:柜机规格最优推荐

作者: 东方欲晓_253c | 来源:发表于2020-05-21 10:48 被阅读0次

作者:金钊、姜东晓

回溯系列一“选址应用”中,我们提到宏观和微观两个场景,宏观选址找到备选小区后,微观选址会对小区内部柜机的点位和规格进行决策。本期来介绍微观选址决策之一,柜机规格最优推荐模型。该模型通过机器学习 + 运筹规划的组合,为每个新小区的规格投放做出有限信息下尽可能更优的建议。

一、业务描述

1.1 规格推荐任务重要性

微观选址聚焦在小区内部,它由一系列决策组成,其中之一就是优势点位被选择后合适的规格建议。规格作为柜机自身最重要的变量,极大影响了一个小区潜在需求变现的程度。规格过大或过小,都会直接导致收益的损失。想象一下,一个件量特别多的小区只投放了较少的格口,白白损失了应有的收益,而一个件量较少的小区投放较多的格口,周转率也只能一直在低位徘徊,投资回报率不佳。

目前这一决策过程是由运营人员在单个备选小区进行详细的件量评估后,再上报总部来确定的。我们希望能将这一过程模型化、规模化、标准化,意义在于如果小区件量评估方式是统一的,那我们就可以将其合理地自动化,而把运营人员从这件事情中解放出来,让他们将精力投入到更需要人的智慧的生产活动中。

所以我们对规格推荐进行了仿真。如下图所示,当向阳光棕榈园小区投放柜机时,系统会根据小区的画像特征,如周边包裹量、楼宇性质、是否可上刊、户数、人数、栋数等13个指标预估出此小区可能的日均派件量为115件,再给出具体的规格建议如投放1台一拖五可以满足这个日均派件量,不会太大也不会太小。

同时,再展示出3个和阳光棕榈园最相似的已投放过柜机的小区,包括它们近一年的日均件量和柜机规格,来佐证我们规格建议的合理性和解释性,并且可以对历史投放规格做出识别和纠正。

1.2 处理上的难点

过去的投放规格的参考意义有待商榷。

由于画像特征的不明晰、数据的欠缺以及人类决策的主观性,导致件量评估决策过程比较困难。

即使评估出了件量,也存在多种规格的组合可以满足这个件量,该如何决定最优组合。

二、技术实现

2.1 机器学习模型预测小区派件量

有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征提取是机器学习建模的第一步,也是最关键的一步。

我们从OA系统的全国柜机表日志中,提取了柜机所在小区的画像信息;并且从数据仓库的全国柜机日kpi日志中,构造了小区的营收环境数据。将这两方面的数据进行整合,作为模型的训练数据存储起来。

之后,我们以上面提取的数据作为特征向量,以小区的日均派件量作为标签,用三层MLP回归模型来进行训练。这里为什么采用三层MLP呢?原因有两个:

(1) OA系统最终可用的小区样本只有13000+个,并且小区特征只有16个,数据量不大,特征维度不高,所以没有必要采用深度神经网络;

(2) Universal Approximation Theorem (Hornik et al., 1989;Cybenko, 1989) 定理表明:前馈神经网络,只需具备单层隐含层和有限个神经单元,就能以任意精度拟合任意复杂度的函数。但在实际工作上,深的还是更好,所以这里采用了两层隐藏层。

2.2 运筹规划模型求出最优规格

在预测出小区的日均派件量之后,该怎么决定投放柜机的规格呢?

这个问题就属于运筹学的范畴了。更具体一点,我们要决定的,是要投放多少主柜(m)和副柜(s),使其在满足一定条件的情况下,达到目标函数的最优值。

因为不能给出诸如0.7个主柜、3.5个副柜这样的建议,所以这是一个整数规划问题。目标函数是投放成本最小。约束条件暂时有两个:a)满足最优周转率;b)副柜和主柜的比值不能超过最大值12。具体的运筹优化模型如下图所示:

2.3 K-Means聚类模型筛选相似小区

在预测出A小区的日均派件量,并给出最优的柜机规格之后,我们接下来要做的是找到A小区的相似小区,看看这些相似小区的件量和规格是怎样的,来验证前两步结果的可信度。

这里我们采用的是两层筛选方案:

 (1) 召回:将全量小区进行K-Means聚类。当查找相似小区时,第一步只需计算A小区与K个中心点的距离,确定A小区属于哪一类,以降低计算复杂度;

 (2) 精排:确定A小区属于哪一类之后,就要计算其和这类小区中所有样本的距离,以精确筛选出top3的相似小区。

通过两层筛选方案,我们实现了快速、精确查找相似小区的功能。此方案具有向后兼容性,即如果未来训练数据增大,我们可以增加K的值,来维持相似小区检索模块的运行速度。

三、总结

我们通过将机器学习 + 运筹规划模型相结合的方式,完成了小区派件量预测及柜机规格拆分,实现了微观选址中一个复杂的决策过程--柜机规格推荐。该模型的数理化、自动化、标准化将客观规律从主观活动中提炼出来,为这一决策活动未来的智能化创造了可能。

运筹规划模型不光能解决如选址这样传统的全局优化问题,也可以与其他学科交叉,完成很多有趣有用的决策过程。接下来我们会再介绍一种通过交通工程 + 运筹规划的方式对海量快递员GPS轨迹数据进行可视化的路网匹配模型,证明了运筹模型在其他领域应用的潜力。

相关文章

网友评论

      本文标题:【技术·分享】优化算法为理性决策赋能系列之二:柜机规格最优推荐

      本文链接:https://www.haomeiwen.com/subject/skzaohtx.html