初识滴滴交易策略之一:交易市场
1. 什么是交易市场(Marketplace)
交易伴随着人类文明而诞生,从古代的以物换物,到现代的服务贸易,通过有效的交换行为促进了人类社会的不断前进。交易市场就是为了实现买家和卖家进行交易的一个环境和规则体系。
现代交易市场不仅提供了商品或服务的买卖功能,也通过平台能力为买卖双方构建更加强健的信任体系和沟通机制,通过公开、透明、公平的交易规则,保障买卖双方的切身权益,提高整个市场环境的运转效率,减少资源错配带来的社会损失。
随着交通和通讯技术的发展,交易市场不再局限于特定的地理位置,而是可以通过网络连接世界各地的买家和卖家。特别的,通过计算机技术的普及,尤其是 2006 年以来新一代人工智能技术的应用,也使得交易市场可以更快速、准确地进行买卖,实现更高效、更贴心、更合理的市场交易决策,进一步提高了交易的效率和体验。
交易市场的本质和网络效应
交易平台的本质是连接与撮合,它希望将原本较难联系的产品或服务的供给方和需求方联系起来,实现匹配与撮合,从而提高整个市场运转效率。
从上图可看出,交易市场中的双边参与方越多,则带来了明显的网络效应,即:
1. 让产品或服务的供给方能够面对更多的潜在需求方,从中挑选更加心仪的购买者;
2. 让产品或服务的需求方能够面对更多的提供者及其差异化产品或服务,从中挑选更加心仪的产品或服务;
这一网络效应,提供了更多的可能来提升整个交易市场运转效率。对此,学术界,特别是经济学和工业工程领域也有非常多的研究。
互联网时代的在线双边市场,将供给方和需求方扩展到小区、城市、国家乃至全世界,极大提升了网络效应(Network Effect),带来了更大的市场效率提升和面向全社会的体验升级。
网络效应为整个交易市场的发展带来了多种好处:
· 随着参与人数增加,网络连接以平方的速度增加,规模迅速扩大
· 更大的双边市场为交易双方提供了更多、更好的选择
· 越多的历史交易行为,可以使得平台更好预测未来交易行为并提供更优质的服务
交易市场带来的社会效率提升
由于计算机网络技术的加持,信息透明、实时沟通使得整个交易市场的效率获得了前所未有的提升,进一步为整个社会的运转提供了润滑和改善。
2017 年,MIT 计算机科学与人工智能实验室(CSAIL)研发了一套全新的共享汽车调度系统,并做了模拟试验,试验从数据上证明了共享汽车在治疗城市交通拥堵、提高社会效率上的卓越表现。
下图展现了该方法中如何匹配和调度司机(绿线)来满足乘客需求(星号),通过仿真研究发现该方法大幅提高了整体交通运转效率。
图片来自:Alonso-Mora, J., Samaranayake, S., Wallar, A., Frazzoli, E., and Rus, D.: On-demand high-capacity ride-sharing via dynamic trip-vehicle assignment, Proceedings of the National Academy of Sciences, Vol. 114, No. 3, pp. 462–467 (2017)
2. 滴滴交易市场有什么技术特点?
互联网的出现和快速发展给交易市场带来了翻天覆地的变化。现如今,交易市场可以被简单地划分成两大类:物品在线双边交易市场和服务在线双边交易市场。
物品在线双边交易市场以阿里巴巴、京东、Amazon、eBay 等为代表。这些交易市场是通过互联网平台连接买家和卖家的,实现商品的展示、交易、付款和配送等一系列流程。这些平台大多提供了丰富的商品品类,从普通的消费品到高端的奢侈品都可以在这些平台上找到。当然这些平台也面临需要承担的责任,比如商品质量的信任问题、交易纠纷的处理问题等等。
服务在线双边交易市场以滴滴、Uber、Airbnb 等为代表。这些平台提供的是服务而非商品的在线交易,比如出行服务、住宿服务、餐饮服务等。这些交易市场利用互联网平台连接服务提供者和服务需求者,为用户提供了更加便捷和灵活的服务体验。这些交易市场也努力保障服务质量和解决服务安全问题。
滴滴作为提供出行服务的在线双边交易市场,为全社会提供了关于出行服务的一个交易平台,这个平台汇集了数亿出行用户和千万量级司机,构建了庞大的双边交易市场,提供了体验优秀、多元化、价格合理的众多出行产品。
在滴滴出行构建的这个庞大的在线服务双边交易市场之中,在技术方面存在着以下特点:
1. 线上线下结合:乘客线上发单,司机线上接单,然后在现实世界中完成出行服务;
2. 平台规则的公正和安全保障:平台为所有乘客和司机提供透明公开的交易环境,并不断努力来保障双方的安全;
3. 数据安全和隐私保障:滴滴需要保证司乘的个人数据安全和隐私,采取一系列技术管理措施来保障数据的安全性和隐私性;
4. 司机和乘客的体验:乘客希望更快速的接驾服务和更便宜的价格,司机希望获得稳定合理的收入,平台需要努力保障各方体验;
5. 多元化的服务形态:滴滴提供了包括快车、优享、专车、豪华车、出租车等多种服务形态,以满足不同人群对于出行服务的不同需求;
6. 规模庞大的全局决策问题:当面对如此大量级的交易问题时,大量传统计算机算法已经失效,需要积极引入人工智能、大数据技术,追求更加智能的智能决策能力;
7. 智慧城市体系中合理的调度和路线规划能力:通过数字孪生技术,在虚拟环境中模仿真实环境,提早预知并调度出行资源,规划行驶路线,提高交通利用率,减少拥堵;
8. 自动驾驶技术:当面向未来的自动驾驶世界,积极探索自动驾驶技术,以提高出行安全性和服务质量,同时降低运营成本。
当面对拥有着庞大而复杂的交易市场时,滴滴交易策略会如何运转呢?
机制设计(Mechanism design)
2007 年的诺贝尔经济学奖颁发给了莱昂尼德·胡尔维茨(Leonid Hurwicz)、埃里克·马斯金(Eric Maskin)和罗杰·迈尔森(Roger Myerson)三位杰出的学者,以表彰他们为机制设计理论奠定了基础。
机制设计(Mechanism design,也被称之为逆博弈论)作为经济学和博弈论领域的重要分支,旨在通过设计经济机制或激励措施来实现特定目标,解决市场环境中的问题。机制设计理论的应用范围非常广泛,从市场设计、拍卖理论和社会选择理论等经济和政治领域,到互联网域间路由和搜索拍卖等技术领域。
滴滴交易市场策略的优化就是一种广义的机制设计,旨在根据市场的特点和参与者的需求,设计出合适的交易机制,以实现多方共赢的目标,促进供需两侧受益。
决策智能(Decision Intelligence)
广义的决策智能是一门将社会科学、决策理论、管理科学等理论与 AI、数据科学相结合的工程学科,它帮助人们利用数据和算法来在复杂社会系统中做决策,从而改善生活、工作和周围的世界。
在交易市场中讨论决策智能,可以狭义理解为利用运筹学、机器学习、因果推断和数据科学来做出更好的交易决策,可以举几个简单例子:
1. 为乘客出谋划策,当乘客在有个性化需求的时候,能够通过哪些车型选择、价格选择来实现打到合适的车;
2. 为司机出谋划策,在全天的出车过程中,为司机建议更好的决策行为,规划最优巡游路线,实现更好的出车体验;
3. 站在平台视角,当预测到暴雨来临的时候,为更加充分满足乘客未来突发的打车需求,从全程的现状和未来预测视角,决策从某个方向更多调度更远司机;
“决策智能”被著名的技术咨询公司 Gartner 评价为正处于快速技术成长期的新兴重要技术之一。
在滴滴的交易市场环境中,面对复杂的决策问题,我们通常需要进行多方面的决策工作,包括但不限于:实时匹配决策、供需调节决策、乘客司机推荐方案、动态决策、安全和判责决策、增长决策等等。
运筹学(Operations Research)
运筹学是近代应用数学的一个重要分支,并在生产、管理等工作中具有广泛现实应用。运筹学面对现实生活中的复杂问题,利用统计学、数学模型、算法等方式去寻求最优或近似最优解,因而也被称之为最优化理论。
传统而言,运筹学研究的范畴包括:数学规划(线性规划、非线性规划、整数规划、随机规划、组合规划等)、图论、网络流、运输问题、网络计划、排队论、存储论、对策论、搜索论、决策分析等领域。随着万物互联时代到来和算力提升,运筹学正在焕发全新的魅力。
对于滴滴的复杂场景而言,几乎所有问题具有现实的复杂性,例如:非常多约束条件下的最优化求解、司乘排队、资源分配等,这些都会依赖于运筹学的形式化数学建模来帮助我们更好解决问题。
当然,运筹学并非一颗“银弹”(Silver Bullet),我们也充分了解到运筹学作为一门非常久远的学科,存在着诸多落地和发展的现实难点:
一方面,将现实问题抽象为数学规划问题,并通过大型求解器快速求解,是我们追求业务效果最优化的有力武器,也让我们面临着很多未知探索领域。
例如:在用户开启相关权限后,为避免打扰用户太多次,限制向用户推荐优惠信息的总频次(约束条件),限制推送的间隔(约束条件),最终使得用户获得的优惠信息最优(最优化目标)。
尤其是,当并不存在唯一最优点的时候,整个收益曲面会构成“帕累托前沿”,我们既可以通过帕雷托前沿上选择不同的点,来更好满足用户的多方面需求(多目标优化),又可以通过产品力提升来整体推进帕累托前沿,取得效果提升。
上图来自:Siurana, Maria & Fernández de Córdoba Castellá, Pedro & Montagud, Arnau & Reynoso-Meza, Gilberto. (2017). Modelling and multi-objective optimisation for simulation of cyanobacterial metabolism.
另一方面,机器学习——尤其是深度学习——对运筹学带来了新的机遇和挑战。传统运筹学发展中更多强调数学推导和启发式方法,而深度学习所带来的强大的学习和运算能力,正在不断为运筹学注入更多的能量。我们所面临的大规模运筹问题,大部分很难依赖传统纯数学方法解决,需要结合深度学习方法来实现快速近似求解或更优的约束条件表征。
强化学习(Reinforcement Learning)
强化学习是机器学习领域中与有监督学习、无监督学习并列的第三种基本学习方法,它不需要带有标签的学习数据,而是通过自身与环境的不断探索,来找到使得最终回报最大的决策方法。
让我们思考一下,面对环境的你需要不断做出动作决策时,如果每步都取当前收益最大的决策,就能获得整个流程最优,则并不需要使用强化学习,只需要学习单步最优的方法即可。
而强化学习所要解决的问题,则是在这类序列决策问题之中,每一步的决策需要为后面行动“留后路”或者“创造更多机会”,从而能够使得整体更优。
以滴滴场景举例:一位司机在半指派模式(允许选接订单)的情况下,可能会考虑到“接一单去热区,那边未来有更多单子”,在这种思考方式下,每次接单可能都会倾向于“为未来创造更多可能”,从而更容易实现全天收入更高。
滴滴平台利用强化学习解决的问题场景非常广阔,在各类序列决策问题之中,以不同视角来构建强化学习的 Environment、State、Action、Reward,可以获得不同的算法结果和策略方式,从而帮助司乘和平台在一系列序列决策问题中获得更大的成功。
因果推断(Causal Inference)
“相关性不等于因果性”——这是 2011 年图灵奖得主、人工智能先驱朱迪亚·珀尔(Judea Pearl)不断呼吁重视的一点。
珀尔在上世纪 80 年代末将因果模型数学化,改变了社会科学对统计学因果关系的理解,并和加州的迈克尔·乔丹(Michael I. Jordan)教授共同将贝叶斯网络、马尔可夫网络、概率方法等引入人工智能,萌发出昌盛的概率图机器学习模型系列。
关于“相关性不等于因果性”,一个简单的例子莫过于:近年来,大气中二氧化碳水平和人类肥胖水平持续上升,这种相关性会让人误解以为二氧化碳导致肥胖,但事实是,经济增长使得人类摄入更多食物从而发胖,经济增长也产生了更多二氧化碳。
很多时候我们希望研究的是:当改变了某个行为(通常称之为 Treatment)之后,会通过因果性造成所希望影响的某个变量的影响是多少(通常称之为 Effect)。并且,很多时候没有办法做完全随机的对比试验,拿到准确的平均影响。
这一研究已经拓展到了诸多领域:2021 年诺贝尔经济学奖授予了 David Card、Joshua Angrist 和 Guido Imbens,为了表彰他们建立了一个因果关系研究的新框架,可以利用自然实验来分析,革新了社会科学领域的实证研究。
在滴滴业务中,司乘、平台会做着不同的决策选择,从而产生不同的业务结果,如果我们希望能够更好决策,则不仅需要了解“相关性”,而更应该了解“因果性”,通过因果推断建模来实现对该决策选择所造成后果的准确预估,继而提供更好的选择,保障司乘权益。
3. 总结
滴滴作为国内的一家出行平台,构建了完整的线上交易市场,为司乘双方全天候提供优质的交易服务。越加复杂的交易市场环境之中,面临的市场决策挑战越大。
在复杂的交易市场之中,滴滴通过技术进步来不断提升市场效率和司乘体验,不断克服种种技术挑战,建立公平的平台规则,提供全面的安全保障,提供多元化的市场服务形态,不断优化交易决策效率,实现多方共赢。
以上内容简要概括了滴滴交易市场面临的技术挑战,希望以上内容能够为您了解交易市场提供帮助,后续将带来具体关于司乘匹配、调节调度、行为推荐等多方面的技术内容。
4.参考资料
1.Evans, David S., et al. "Platform Economics: Essays on Multi-Sided Businesses." (2011).
2. Pratt, Lorien. Link: How Decision Intelligence Connects Data, Actions, and Outcomes for a Better World. Emerald Group Publishing, 2019.
3. Myerson, Roger B. Mechanism design. Palgrave Macmillan UK, 1989.
4. Is Decision Intelligence The New AI? https://www.forbes.com/sites/forbestechcouncil/2022/05/25/is-decision-intelligence-the-new-ai/?sh=78404df74e42
5. Kraus, Mathias, Stefan Feuerriegel, and Asil Oztekin. "Deep learning in business analytics and operations research: Models, applications and managerial implications." European Journal of Operational Research 281.3 (2020): 628-641.
6. Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
7. Pearl, Judea, and Dana Mackenzie. The book of why: the new science of cause and effect. Basic books, 2018.
关注滴滴技术公众号,获取更多技术干货
版权声明: 本文为 InfoQ 作者【滴滴技术】的原创文章。
原文链接:【http://xie.infoq.cn/article/ed456691973e1ea0348efac09】。文章转载请联系作者。
评论