写点什么

游戏用户 LTV 预测实践

  • 2021 年 12 月 30 日
  • 本文字数:2369 字

    阅读完需:约 8 分钟

游戏用户LTV预测实践

1、背景


LTV 即用户生命周期价值,指用户从获客到流失全程的经济价值。作为衡量游戏中用户的价值的重要指标,LTV 在游戏评级、用户质量评级、用户增长等应用中具有至关重要的参考价值。不同游戏的 LTV 直接影响其 ROI(投资回报率),体现游戏的市场价值。以游戏 LTV 的发展趋势与幅值为参考指标,对游戏进行评级,可以帮助游戏广告投放人员合理地调整不同游戏的资源投放比例;以用户群 LTV 的发展趋势与幅值为参考指标,对用户群的价值评估,可以帮助游戏广告投放人员合理地调整用于不同用户渠道的资源投放比例。

LTV 预测的最大痛点在于游戏初期的预测。目前业内的预测方法大多基于足量的历史数据(>=30 天),而在实际应用场景中,往往在游戏上线一周这样的短时间内,即需要预测未来长达半年甚至一年的 LTV 情况。


2、目标


由于 LTV 预测与游戏业务紧密相关,我们的 LTV 预测项目目标为实现下几个功能:

  • 对于游戏新增用户未来至少 180 天的留存率和 LTV 的预测,达到具备应用价值的准确率水平。

  • 实现实时、准确的日更新报告机制。

  • 针对不同业务需求的高度可塑性和适用性。

  • 完善的监控体系。


3、算法迭代

3.1 曲线拟合法

在游戏行业中,曲线拟合 LTV 算法是最普遍的一种,其中以逻辑回归拟合法和幂函数拟合法应用最广。根据前 7 日的历史 LTV 数据,拟合出未来 90、180 乃至 365 天的 LTV 预测值。

A) 逻辑回归拟合法

模型公式:


其中 c,k,a 为常数。这种模型由于其收敛性,适用于游戏情况随时间发展趋于稳定的情况,对于能长时间保持良好表现的游戏将不适用,在我们的场景中,这个模型对 30 天 LTV 平均预测准确率仅有 61%,对 365 天 LTV 平均预测准确率仅有 17%。

B) 幂函数拟合法

模型公式:


其中 a、b 为常数。这种模型不具备收敛性,但可以可调节地实现拟合 LTV 不同程度的增长趋势。然而,这种模型的参数少,模型结构单一,难以将活动等噪声对 LTV 曲线的影响计算在内,鲁棒性低。在我们的场景中,这个模型对 30 天 LTV 平均预测准确率为 72%,对 365 天 LTV 平均预测准确率为 23%。


3.2 留存 ARPU 拆解法

3.2.1 留存率预测

相比于业内普遍的幂函数直接拟合方法,考虑到积分系统具有更高对鲁棒性,我们采用幂函数拟合 LT(用户生命周期,即留存率的积分),再对预测 LT 求微分得到预测留存率,来降低由运营活动等原因造成的留存率波动对留存率预测的影响,提升预测的稳定性。

在我们的场景中,这种方法将 30 天留存率的平均预测准确率由 78%提升至 92%,并在 365 天留存率的预测中平均达到 77%的准确率。

 

3.2.2 ARPU 预测

ARPU 预测相比留存率的预测则显得更为复杂,不同游戏不同渠道不同用户群体的 ARPU 表现参差不齐,需要结合实际业务场景进行算法选择。

a) 平均 ARPU

假设游戏新增用户的 ARPU 较稳定,我们直接采用已有的 ARPU 历史数据的平均值来代替未来的 ARPU 值:


b) 活动修正 ARPU

游戏新增用户的 ARPU 通常随着时间推移逐渐衰减,即用户付费能力下降,我们采用幂函数拟合 ARPU 的方法,预测未来的 ARPU 值。但单一的幂函数并不能反应活动等因素产生的 ARPU 的波动:


ARPU 的波动由多种因素产生,而其中最主要的影响来自于运营活动。考虑算法技术依赖具体业务场景才能发挥最大的效能,为了能够更加准确地预测具有波动性的 ARPU,我们与运营同学合作,利用运营活动日历,对幂函数拟合预测 ARPU 进行修正:


其中 eARPU 为活动对 ARPU 对影响值。

再与预测的留存率进行卷积得到预测 LTV:


我们的场景中,这个模型对 30 天 LTV 平均预测准确率为 88%,对 365 天 LTV 平均预测准确率为 67%。


3.3 基于机器学习的 LTV 预测

在实际的应用场景中,批量获取到多个游戏的长期运营活动信息做辅助并不是一件容易的事,因此我们采用了一种基于机器学习的 LTV 预测方法。

3.3.1 特征工程

我们筛选出共两类特征:游戏基础信息特征和用户短期付费信息特征。前者包括游戏 ID、类型等游戏基础信息而后者包括历史留存、LTV 等付费信息。

3.3.2 模型选型

我们提取了多种类且多数量的游戏信息,其不同特征的重要性各不相同。因此我们选择采用 Xgboost 模型,其对于特征的透明特性可以在模型中分类出重要性低的特性,给予较低的权重,避免过拟合。


3.3.3 架构设计


通过特征工程提取、结合游戏基础信息和用户短期付费信息,得到训练特征集,使用用户长期付费信息(如 365 天 LTV)作为训练标签,输入到 Xgboost 模型训练模型。

对于待预测对象我们同样进行特征工程得到预测对象的特征集合输入训练后的模型,Xgboost 模型将输出预测结果并通过 SMTP 服务器传送到下行链路。

我们的场景中,这个模型对 30 天 LTV 平均预测准确率达到 90%,对 365 天 LTV 平均预测准确率达到 71%。

 

4、结果与结论

4.1 算法表现

我们通过拟合 LT 的方法,用 7 天数据预测未来趋势,实现 30 天留存率预测平均准确率达 92%,实现 365 天留存率预测平均准确率达 77%。

在应用活动信息修正预测 ARPU 后,我们实现 30 天 LTV 平均预测准确率高达 88%,实现 365 天 LTV 预测平均准确率达 67%。

在应用机器学习模型后,我们实现 30 天 LTV 平均预测准确率高达 90%,实现 365 天 LTV 预测平均准确率达 71%。



4.2 风险与前置条件

由于实际应用中诸多不可控因素将对算法表现产生不确定影响,算法能稳定实现较准确预测需要预测对象满足一些前置条件,例如:

  • 足量的历史留存和付费数据;

  • 足够多的新增用户数;

  • 有一定可观的付费转化率;

  • ARPPU 出于游戏合理范围内。

另一方面,机器学习模型在面对一款全新类型的游戏(与历史所有游戏都差异甚远)时,预测能力将下降;当前条件下,机器学习模型适用于有历史类似游戏的情况。

 

5、后续计划

由于目前机器学习模型是独立于业务细节的模型,虽然具有不错的表现,但面对全新游戏的场景,仍有提升潜力,我们接下来将把业务细节(如活动信息等)加入到特征工程,扩展模型输入,并进一步引用深度神经网络优化模型结构,一种潜在的方案为采用多任务深度模型,通过级联允许模型中链接业务信息调整模型参数,在测试场景中,实现了 93%的 30 天 LTV 预测平均准确率,后续将进一步研究与验证。


文 / 游戏发行事业部 数据部 算法团队

发布于: 刚刚
用户头像

bilibili游戏技术 2021.05.20 加入

分享bilibili游戏技术干货

评论

发布
暂无评论
游戏用户LTV预测实践