百分点数据科学实验室:零售行业新店品类配比测算方案
编者按:零售行业是数据科学的重要应用领域之一。零售领域有着丰富的数据和大量的优化问题,如商品定价、折扣、库存水平、客户分类、订单挑选与配送,以及品类配比等。
本篇文章结合百分点数据科学实验室的实践经验,分享了新开门店品类配比优化问题。例如,某综合性商场计划开业,如何配比各品类商品,才能够让各品类的销售额、毛利额、毛利率以及所占面积在约束范围内,实现新开门店最佳综合效益。
在零售商品定价问题中,销售商考虑到商品进货时间、批量及存储费用等约束,建立优化模型制定价格策略:目标为极大化总收益,约束条件是分别对库存与价格规定上下限,从而求得商品在某季节的最优定价[1]。零售客户分类问题本质上是利用优化算法对客户进行聚类,根据结果对各个类别客户的特点进行分析,提出针对性的营销及决策方案[2]。在零售订单挑选与配送问题中,考虑订单的总延迟时间、违约率与履约总成本这三个目标,约束条件考虑每个订单的履约时间窗,订单拣选顺序,订单配送车辆路径等因素,建立订单拣选排序与配送的联合优化模型,通过优化算法进行求解,从而解决订单履约时间较长的问题[3]。
针对某集团品类规划部门对于新开门店的品类配比测算需求,项目组针对零售实体商店的商品品类配比决策模型进行研究。在查阅总结了多篇相关论文资料后,项目组将新开门店品类配比的目标锁定为门店效益最佳,即销售毛利综合最优,约束条件考虑各品类的销售额、毛利额、毛利率以及所占面积,建立线性规划模型,求解不同品类的销售毛利配比,为品类规划部门提供合理的新店品类配比方案,帮助客户运用数据建立最优化模型进行科学决策,从而提高新开门店预期收益。
一、解决方案-模型篇
1. 最优化算法
在现有零售行业品类配比研究中,使用较多的是最优化算法[4][5]。下方给出优化算法的基本结构。
这里,x={x1,…,xn}称为问题的决策变量,函数 f0 称为目标函数,不等式 fi(x)≤0 与等式 hi(x)=0 称为约束条件。在所有满足约束的向量中,向量 x*对应的目标函数值最小,那么称 x*为该问题的最优解。
所谓优化算法,其实就是构造一种搜索规则,基于某种思想和机制,通过搜索规则寻找到满足用户要求的问题的解。具体来说,优化算法是在从众多可能的选择中做出最优选择,使得系统的目标函数在约束条件下达到最大或最小。
按约束条件分类,优化算法可以分为无约束的优化问题、有等式约束的优化问题与有不等式约束的优化问题。
最优化问题又可以根据目标函数的状态分类,如下图所示。
2. 凸优化算法
在连续最优化问题中,凸优化是非常特殊的。凸优化在数学规划领域具有非常重要的地位。从应用角度看,一旦将一个实际问题表述为凸优化问题,大体上更意味着相应问题已经得到彻底解决,这是非凸的优化问题所不具有的性质。从理论角度看,用凸优化模型对一般性非线性优化模型进行局部逼近,始终是研究非线性规划问题的主要途径。
求解无约束的凸优化问题,通常使用的方法是 Fermat 定理,即求解目标函数 f0 的梯度,令其为零,解得最优值为全局最优点。
求解仅含等式约束的凸优化问题,通常使用的方法是拉格朗日乘子法,即构造拉格朗日函数,对各个变量进行求导,令其为零,解得最优值为全局最优点。
求解含不等式约束的凸优化问题,通常使用的方法是 KKT 条件,通过 KKT 条件,求解最优值。
3. 线性规划
在凸优化问题中,线性规划又是极为代表性的一类问题。虽然按约束条件分类,线性规划问题属于最复杂的含不等式约束的凸优化问题,但是由于其结构的特殊性,即目标函数与约束条件都是线性的,线性规划问题有成熟的求解算法包对问题进行求解。可以利用 python 或 R 等编程语言调用线性规划算法包,快速得到线性规划问题的最优解。
其中,向量 c,a1,…,am ∈ Rn,b,…,bm ∈ R 是问题参数。
4. 模型的选择
非凸优化问题是非常难求解的,因为可行域集合可能存在无数个局部最优点,求解全局最优的算法复杂度是指数级的;而凸优化问题具有任何局部最优解即为全局最优解这一优良性质,因此,利用如贪婪算法或下降方法可以非常高效地对问题进行求解。考虑到模型算法的效率与可解释性,在本次品类配比测算中,项目组将使用凸优化算法中的线性规划模型搭建新店品类配比测算模型。
二、解决方案-业务篇
项目组选择了线性规划算法作为新店品类规划的基础算法,并根据业务需求,制定了两套模型解决方案,建模框架如下图。
线性规划模型由两个部分组成,其一是目标函数,其二是约束条件,目标函数与约束条件都是由决策变量构造的线性函数。模型构建的重中之重,是根据业务需求,构建线性规划模型的目标函数与约束条件。
1. 目标函数
本次项目的目标是找到让新店效益最佳的品类配比方案。因此,目标函数的构建需要紧扣“门店效益”。项目组将门店效益刻画为各个品类的销售额之和与毛利额之和的总和,用 xi1 来表示第 i 个品类的销售额,用 xi2 来表示第 i 个品类的毛利额,那么目标函数就可以写为:
2. 约束条件
约束方法根据业务部门的需求,建立了两种不同的模型测算方案。模型 1 依据业务部门的预测业绩数据对各品类的销售额、毛利额、毛利率及坪效进行约束限制;模型 2 依据与新店类似的两个老店的历史业绩数据对新店各品类销售额、毛利额、毛利率及坪效进行约束限制。
首先聚焦模型 1 的约束条件。业务部门提供了对新开门店未来三年各品类的销售与毛利业绩预测。对于各品类销售额与毛利额的约束,将预测最小值作为约束下限,将预测最大值作为约束上限,从而完成对销售额与毛利额的约束条件构造。
对于各品类毛利率的约束,将预测最大值作为约束上限,将预测平均值作为约束下限,从而完成对各品类毛利率约束条件的构造。
坪效是计算商场经营效益的重要指标。模型除了对各品类的销售额毛利额以及毛利率进行约束以外,还补充了利用各品类坪效对各品类面积的约束,使得模型结果符合门店经营规模,合理有效。
模型 2 的约束条件与模型 1 类似,区别在于,当利用与新店类似的两个老店历史业绩数据对新店各品类进行约束时,需要将数值转化为占比,规则如下:
三、建设成果
根据解决方案-业务篇搭建的模型架构,利用 R 语言 Rglpk 包的 Rglpk_solve_LP 函数进行求解,得到结果如下:
对比两个模型的销售额占比结果,可以看到,模型 1 直接利用业务部门预测数据计算坪效,可能会导致结构失衡,体现在品类 6 的销售额占比偏高;而模型 2 完全基于历史数据,与模型 1 相比,品类 1 销售额占比偏低,品类 7 销售额占比偏高。
同时,我们也可以得到两个模型的毛利额占比结果,从结果图中看到,模型 1 在品类 6 上也出现了同样的问题,直接利用业务部门预测数据计算坪效,可能会导致结构失衡,体现在品类 6 的毛利额占比也偏高;而模型 2 完全基于历史数据,与模型 1 相比,品类 7 毛利额占比偏低;对于品类 9 而言,因为 B 店无品类 9,A 店品类 9 的品牌数量也非常少,品类 9 完全依赖历史数据结果偏高。
对比模型 1 与模型 2,两者本质区别在于,模型 1 完全利用业务部门的预测业绩数据作为约束条件,而模型 2 则是完全基于与新店类似的老门店的历史业绩数据构造约束条件。为确定选取哪个模型作为最终结果,项目组与品类规划部门进行了充分的沟通确认,品类规划部门表示希望可以尽可能少地利用人为预测数据,因此,品类规划部门与项目组共同确认以模型 2 作为实际应用模型。
聚焦模型 2 的结果,门店的销售额指标中,品类 7 的占比远超其他品类,第二梯队是品类 1、品类 8 与品类 9,第三梯队是品类 5、品类 6 与品类 3,品类 4 与品类 2 占比最低。门店的毛利额指标中,依然是品类 7 的占比远超其他品类,第二梯队的是品类 1、品类 8 与品类 9,第三梯队是品类 5 与品类 3,品类 4、品类 6 与品类 2 占比最低。详见下图。
待门店开业后,可利用模型基于第一个月/第一年的数据进行迭代,产出下月/年的品类配比最优解,调整各品类所占经营面积,依次迭代,持续优化品类配比结构,不断提高门店的下一期预期收益。
结语
本次结合优化算法与业务需求所形成的品类配比测算方案,主要应用于新店品类配比规划,其简化模型也可应用于已开门店的品类配比优化。模型核心在于,在合理范围内调整各品类的配比结构,提高门店未来一期的预期收益。
品类配比规划是优化模型在零售行业中的一个分支应用,也是数据挖掘技术在零售行业中的一个应用案例。优化算法等数据挖掘技术赋能零售业,提高数据利用率,将零售行业中大量数据转化为有效决策,实现智慧零售转型,提高零售企业自身竞争力,在激烈的市场竞争中立于不败之地。
参考资料
[1]王宏达.电子商务环境下几种典型商品的定价策略研究[D].东北大学,2006.
[2]姚思雨. 改进蚁群聚类算法在零售客户分类中的研究与应用[D].大连海事大学,2018.
[3]王学辉. 新零售下 X 生鲜超市订单拣选与配送联合优化研究[D].北京交通大学,2019.
[4]HarigaM A , Al-Ahmari A , Mohamed A R A . A joint optimisation model for inventoryreplenishment, product assortment, shelf space and display area allocationdecisions[J]. European Journal of Operational Research, 2007, 181(1):239-251.
[5]孙淑军, 傅书勇, 零售商店商品品类陈列决策模型应用分析[J]. 沈阳工业大学学报(社会科学版), 2010, 3(1):63-65.
评论