网约车合乘均衡匹配与激励策略

2024-03-28 15:16彭子烜崔林郭志伟陈晗阳魏丽英
关键词:合乘流向算例

彭子烜 崔林 郭志伟 陈晗阳 魏丽英†

(1.北京交通大学 交通运输学院,北京 100044;2.北京交通大学 计算机与信息技术学院,北京 100044)

网约车行业的快速发展重塑了城市的出行服务,有利于缓解城市“打车难”问题[1-2]。由于一些大城市高峰期打车需求仍大于供给,因此网约车平台提出了激励驱动机制以调节供需[3]。如Uber设计了峰时定价来平衡乘客需求和司机可用性;滴滴鼓励乘客支付一定的调度费来增加司机接单的机率。无论是峰时定价还是补贴方式,乘客只能被动接受运价自动大幅上调,或因网约车司机等单或恶意不接单而补贴更多调度费,为平台或司机的价格相关行为支付更多的时间和费用[4-5]。因此,如何设计反映乘客支付意愿且额度合理的激励策略,对调节网约车供需关系至关重要。

目前,网约车订单中合乘订单占比不足10%。由于一些乘客拼车动力不足,部分潜在合乘匹配无法成行。通过调查,约52%的乘客愿意在高峰期转让部分剩余(相当于额外分担15.8%的车费)给合乘乘客,以激励方式提高其他乘客的合乘意愿,实现快速匹配[6]。因此,乘客与司机之间、乘客与乘客之间的激励驱动将影响其选择行为,进而改变合乘模式下的匹配均衡。网约车平台基于乘客剩余自动决策激励策略选择和均衡匹配,帮助乘客以最少的激励匹配到可获得的最佳司机和合乘乘客,从而实现网约车运力资源的充分利用和自调度。

网约车定价或补贴的相关研究主要分为两类。一类是基于规则的定价或补贴策略,如峰时定价、时空定价和成本分摊等。刘洋等[7]研究了3 种高峰期补贴策略,讨论了不同乘客市场规模下各策略的适用性;Cachon等[3]提出当劳动力成本较高时,峰时定价对供需双方是有利的,司机方可以更好地利用运力,乘客方在平峰需求下可以享受较低的价格,在高峰时提高服务可获得性;Zhu 等[8]设计了平均场马尔科夫决策模型模拟网约车市场的动态性,从系统视角提出时空补贴以平衡短期收益最大化目标和长期服务率最大化目标;李兴华等[9]分析了网约车拼车折扣策略对拼车的诱导效果,相比于网约车涨价和停车收费涨价,乘客对拼车折扣的敏感性更高。另一类是基于协商的定价或补贴策略。周乐欣等[10]设计了双边报价交易机制,乘客和司机可根据自身特征如用车紧急程度、期望收益等进行报价,平台自动生成最终价格和匹配结果;赵道致等[11]考虑了网约车和出租车两种出行服务,建立了两者的竞争定价模型,讨论了均衡定价条件和策略;Lam[12]为了防止提高运价,提出了基于维克里-克拉克-格罗夫斯的定价机制,以社会福利最大化为目标,确定乘客运价。

上述研究多是从供给侧通过激励司机以促成更多的合乘出行,很少从需求侧考虑乘客间的激励对乘客合乘意愿和行为的影响。本文考虑乘客可以通过激励司机或其他乘客以获得出行服务,设计了3 种激励策略和策略执行条件,建立了合乘模式下模拟匹配决策和激励驱动选择交互的乘客-网约车均衡匹配模型,分析不同供需比例下3种激励策略的适用性,从而为现实中网约车合乘提供价格指导。

1 问题描述

在网约车出行服务中,平台通过智能手机端可以获得司机和乘客提交的车辆位置、乘客起点、终点、时间要求、价格要求等信息,并形成出行方案。对于司机或乘客,在不同的出行方案中,其获得的收益或出行成本不同。为了保证乘客和司机的利益,避免恶意竞争和无效激励,网约车平台通过设计匹配和定价规则,自动匹配乘客和司机并生成车费,使得没有司机或乘客存在单方面改变匹配对象的动机,从而实现匹配均衡。

在图1 中,有一个司机和两个乘客,生成了3个出行方案。在方案1和方案2中,司机分别单独搭载乘客1 和乘客2,以最短路径完成服务。在方案3 中,乘客1 和乘客2 合乘出行,并获得合乘车费折扣。假设司机期望获得更高利润,而乘客希望节约出行成本(车费和时间成本),司机和乘客对出行方案的偏好如表1所示。以司机为例,相比于出行方案3,司机更偏好出行方案1。

表1 出行方案偏好排序Table 1 Preference lists of travel schemes

图1 网约车合乘匹配与激励过程示例Fig.1 An illustration for taxi-sharing matching and incentive

由于司机和乘客1 将出行方案1 排在首位,均衡匹配为司机匹配乘客1。乘客2 为了获得出行服务,如果单方面激励司机,则需要提供给司机8元激励以改变司机偏好排序。如果同时激励司机和乘客1,则需要分别提供给他们1元激励,即可改变其偏好排序。此时,网约车平台指派司机服务乘客1和乘客2。司机获得14 元利润,乘客1 和乘客2 的出行成本分别为21 元和11 元。此时,司机和乘客均无法通过单方面改变匹配对象或者激励额度以获得更高的效用。相比于从供给侧单独激励司机,与其他乘客形成运力竞争,从需求侧激励合乘乘客可以在保证运力的同时降低激励额度。

2 模型构建

本文基于司机和乘客对出行方案的选择偏好,对合乘模式下的均衡匹配状态进行定义和表达,构建了考虑激励的乘客-司机均衡匹配模型。考虑乘客出行的便利性,本文参考滴滴出行,最多两个订单乘客合乘出行。出行方案指司机和乘客的可行组合,即在司机服务下,乘客的时间窗、成本限制、绕行限制都能被满足;乘客-司机匹配解定义为出行方案的子集。模型部分应用的变量及参数如表2所示。

表2 变量及参数列表Table 2 Table of variables and parameters

2.1 均衡匹配状态

对于一个乘客-司机匹配解来说,当没有乘客或司机能够通过单方面改变匹配对象或激励以获得更高效用时,该匹配解是均衡的。均衡匹配状态定义如下。

定义1如果存在一个出行方案si∉μ且满足Cp(si) Rt(μ(t)), ∀p∈si,∀t∈si时,乘客-司机匹配解μ存在均衡阻碍方案。

定义2当乘客-司机匹配解不存在均衡阻碍方案时,该匹配是均衡的。

2.2 考虑激励的均衡匹配模型

式(1)为目标函数,最大化乘客总剩余。式(2)和(3)保证每个司机和乘客只能参与一个出行方案。式(4)是均衡匹配条件,当一个出行方案被选择时, 根据式(2)和(3), 可得xi= 1,和, 即xi+,表明出行方案xi中的乘客和司机已匹配到当前能够获得的最优的匹配对象,不满足定义1 中的条件,出行方案xi不是当前匹配解的均衡阻碍方案。当一个出行方案未被 选 择 时 ,xi= 0, 由可 得或/和,表明至少有一位乘客或者司机在其他已选方案中获得更高的效用,不满足定义1中的条件,出行方案xi不是当前匹配解的均衡阻碍方案。满足式(4)时,无论出行方案被选择与否,均不是当前匹配解的均衡阻碍方案,即满足定义2。该约束与定义1和定义2一致。式(5)表示司机在出行方案中可获得的利润,即从车费和激励之和中扣除运营成本。式(6)表示乘客在出行方案中的总出行成本,包括车费、激励和时间成本。式(7)表示车费,参与合乘的乘客可以享受车费折扣。式(8)表示乘客的剩余。

2.3 激励策略

激励是调节供需关系的有效方式之一。然而,乘客无策略地提高对司机的激励可能反而会加剧乘客间的竞争。实际上,乘客不仅可以从供给侧激励司机获得出行服务,还可以从需求侧激励其他乘客,促成合乘出行。

(1)乘客激励策略

图2 乘客激励策略Fig.2 Passenger incentive strategy

(2)司机激励策略

图3 司机激励策略Fig.3 Driver incentive strategy

(3)乘客和司机激励策略

图4 乘客和司机激励策略Fig.4 Passenger and driver incentive strategy

3 列生成算法设计

本文设计列生成算法对乘客-网约车均衡匹配模型进行求解[13-17]。Δ(si)为支配出行方案的方案集合,本文将模型重构为集合划分模型。

在确定激励额度下,均衡匹配模型能够重构为如下主问题。

主问题[MPω]:

如果出行方案si被选择,则χi为1,否则为0。式(14)最大化乘客总剩余,式(15)-(17)保证匹配是均衡的。

为了避免生成所有出行方案,本文设计了定价子问题生成消减成本最小的列,如式(19)和(20)所示。式(19)表示如果出行方案是主问题的列,则司机、乘客、阻碍方案将对应一个权重。令qˉi表示方案i的消减成本;qi表示方案i被选择时,对偶变量π之和;πt、σp、οi,j分别表示式(15)-(17)的对偶变量。

在本文中,以司机出行方案选择设计定价子问题,对于每个定价子问题将负消减成本最小的列加入到主问题中。如果司机t选择出行方案si,则0-1变量yt,i为1,否则为0;zi′,j表示均衡阻碍方案的惩罚系数。如果乘客选择出行方案,则0-1 变量为1,否则为0;如果满足Cp(si)

式(21)表示司机的消减成本;式(22)和(23)表示每个司机和乘客只能参与一个出行方案;式(24)表示zi′,j和si的关系。

乘客-司机匹配与乘客价格策略间存在着相互影响的关系,网约车平台根据乘客的最大可接受成本和激励策略模拟乘客激励过程,直至没有乘客有动机改变当前激励策略,从而实现自动生成激励额度和匹配结果。因此,本文将3种激励策略与匹配算法结合,设计了匹配与激励迭代算法框架。相比于单次确定价格匹配方法,匹配与激励迭代算法可以模拟每个乘客面向当前匹配对象和剩余时的激励策略选择过程,构建匹配与激励的互动反馈关系;同时,3 种激励策略条件的引入避免了无效搜索,可以提高算法效率。具体算法流程如下所示,外层始终循环直至exit do满足,χ代表最优均衡匹配解。

匹配-激励迭代算法://1:2://3:4:5:6:7:8:9:10:11:12:13:14:15:16://17:18:19:20:21:22:23:24:生成初始解Ω ←每个司机t 选择最偏好的乘客p;ω ←0,check ←0;生成最优均衡匹配解Do Do while (check = 0)check ←1;χ ←求解[MPω];(π,σ,ο) ←求解[MPω]对偶问题;For (t=1;t ≤|T|;t ++) do求解[PSPω t];If (存在负消减成本列) then Ω ←Ω ∪最小消减成本列;check ←0;End if End for End do χ ←求解[MPω];更新激励策略If (乘客激励策略or 司机激励策略or 乘客和司机激励策略能够在χ中执行) then ω ←在χ中执行乘客激励策略or司机激励策略or乘客和司机激励策略;Else Exit do End if Loop (1)输出χ最优均衡匹配解;输出ω最优激励额度.

4 实证分析

本文以大连市中山区、西岗区、沙河口区、高新区、甘井子区为研究范围,路网总长度为402 km,包含228 个节点和383 个路段。通过大连市出租车GPS数据,可以获得乘客上车点、下车点、上车时间、下车时间和空驶车辆位置。由于乘客时间窗无法获得且合乘过程可能会产生不可避免的绕行时间和等待时间(本文定义为预留合乘时间),假设乘客最早出发时间为上车时间,乘客最晚到达时间为乘客上车时间、乘客起点到终点出行时间和预留合乘时间之和,预留合乘时间假设以(5,30) min 均匀随机生成。车辆运营成本为0.5元/km,乘客时间成本为26元/h,车费为3元/km,合乘折扣系数为0.8。乘客最大可接受时间成本为乘公交出行的广义出行成本;乘客最大可接受绕行距离为单独出行距离的30%。

激励策略主要与供需比例和乘客的剩余相关。本文主要讨论不同激励机制的差异以及供需比和合乘折扣系数对激励策略实施的影响。而乘客最大可接受出行成本也会影响激励策略,由于平台不会干预乘客最大可接受出行成本,因此本文不对其进行讨论。

4.1 不同激励机制分析

在实践中,早高峰普遍存在需求大于供给的情形。滴滴平台鼓励乘客自愿随机支付2~20 元调度费给司机以提高订单响应机率,即乘客支付调度费的范围是输入条件,而乘客支付的调度费是输出结果,调度费由乘客流向司机。本文以20个400-800算例(400-800 表示算例包含400 名司机和800 名乘客),对提出的自动激励机制和实践中随机调度费机制进行比较。

相比于随机调度费机制,本文提出的自动激励机制可以提高乘客匹配率,获得更高的乘客剩余。这是因为在自动激励机制下,乘客可以避免无效的激励并且有更多乘客选择合乘出行。如表3 所示,随机调度费机制可以使司机获得更高的激励额度,但司机的平均收益低于自动激励机制。调度费可以实现司机的自调度,但是不能同时增加乘客和司机的效用。如尽管支付了较高的调度费,仍有部分乘客在高峰期无法匹配到运力,更多司机只搭载一位乘客,浪费了运力资源。相比之下,本文提出的自动激励机制能够促成更多合乘,缓解打车难问题,同时系统根据匹配状态自动决策乘客应该支付的激励额度,乘客剩余可提高12.6%。在自动激励机制下,更多的乘客合乘出行,司机的平均收益也提升了16.7%。

表3 不同激励机制比较Table 3 Comparison of different incentive mechanisms

4.2 激励策略分析

本文设计了不同乘客和司机规模的算例对激励策略的使用比例和激励流向进行分析。在不同算例下,乘客激励策略、司机激励策略、乘客和司机激励策略的使用情况如图5 所示。其中,800-400 表示算例包含800名司机和400名乘客,以此类推。

图5 激励策略在不同案例中的应用Fig.5 Incentive strategies using in different cases

以400-800 算例为例,在乘客-司机均衡匹配中,司机激励策略与乘客和司机激励策略使用百分比分别为39%和51%。在该算例下,由于乘客数量较多,司机可以匹配到利润高、绕行少的乘客。这意味着当未匹配到运力的乘客选择他们更偏好的出行方案时,这类方案通常会给司机和合乘乘客带来时间或费用上的损失,因此,更多乘客根据司机激励策略与乘客和司机激励策略为司机提供激励。如图6所示,约74%的激励流向了司机,26%的激励在乘客间转移以实现更多的合乘出行。

图6 激励流向比例和平均激励比较Fig.6 Composition of incentive and average incentive

在800-400 和800-800 算例中,乘客激励策略的使用占比最高。运力充足时,乘客更偏好与行程相似的乘客合乘,同时司机也可以减少绕行。当乘客选择更优选的方案时,大多数司机是受益的。然而,一些乘客可能会因为合乘服务顺序而增加时间成本。因此,乘客向合乘乘客提供激励,以提高其参与合乘的意愿,超过60%以上的激励流向了乘客。

各算例计算时间如表4所示,随着算例规模的增加,计算时间不断增加,除了800-800算例计算时间超过1 min外,其余算例计算时间均在1 min以内。当算例中司机和乘客总人数相同时,乘客数量占比高的算例计算时间高于司机数量占比高的算例。

表4 算法效率Table 4 Efficiency of algorithm

4.3 合乘车费折扣影响

本文讨论了合乘车费折扣对激励的影响,如图7所示。较低的合乘车费折扣系数能够生成更多的出行方案,乘客间的竞合关系将改变出行方案集合。在400-800算例中,由于需求大于供给,随着合乘车费折扣系数增加,流向司机的激励比例提高且始终高于流向乘客的激励比例。当合乘车费折扣系数较高时,合乘带来的车费减少可能小于因绕行产生的额外时间成本,部分乘客的合乘意愿降低,在需求大于供给时乘客更倾向于提供激励给司机以获得运力,超过90%的激励流向司机。

图7 不同合乘折扣系数下的激励流向比较Fig.7 Composition of incentive with different discount rates

在800-400 和800-800 算例中,流向司机的激励变化情况比较相似。由于需求小于供给,大部分乘客可以匹配到运力,当合乘车费折扣系数较低时,相比于单独出行,部分乘客愿意激励其他乘客合乘,因此流向乘客的激励高于流向司机的激励。当合乘车费折扣系数较高时,乘客更愿意单独出行,为匹配更偏好的司机,流向司机的激励高于流向乘客的激励。

5 结论

本文研究了合乘模式下乘客和网约车的匹配均衡和价格均衡,乘客可以通过提供激励给司机和其他乘客以获得更高的剩余。根据均衡阻碍方案定义,设计了乘客激励策略、司机激励策略、乘客和司机激励策略,并通过列生成算法求解。网约车平台自动匹配并生成包含激励的总运费,保证没有司机或乘客有动机单方面改变匹配对象。得到的主要结论如下:

(1)与实际中的随机调度费机制相比,从供给侧和需求侧出发,同时激励司机和乘客的自动激励机制在提高乘客匹配率的同时,也提高了乘客的剩余。在自动激励机制下,更多的乘客合乘出行,司机的平均收益也提升了16.7%,避免了乘客间的价格竞争和无效激励。

(2)在不同的供需场景下,乘客的激励策略和激励流向不同。当需求大于供给时,司机处于优势一方,更多乘客采取了司机激励策略与乘客和司机激励策略,因此,大部分激励流向了司机。当需求小于供给时,乘客处于优势一方,更多乘客采取了乘客激励策略,因此,大部分激励流向乘客。与需求小于供给相比,当需求大于供给时,乘客和司机获得的平均激励额度更高。

(3)合乘折扣系数也是影响激励流向的关键因素。当乘客合乘不享受车费折扣时,更多乘客偏好于单独出行方案,超过90%的激励流向司机。为了提高乘客的匹配率和司机的收益,网约车平台应同时实施合乘折扣策略和激励策略,以促成更多合乘出行。

猜你喜欢
合乘流向算例
基于人工智能出行算法的网约合乘行为法律规制
小溪啊!流向远方
车辆合乘问题的分布式复合变邻域搜索算法*
考虑性别偏好影响的通勤合乘匹配模型*
基于博弈论的汽车合乘推广研究
十大涨幅、换手、振副、资金流向
基于振荡能量的低频振荡分析与振荡源定位(二)振荡源定位方法与算例
流向逆转的启示
互补问题算例分析
基于CYMDIST的配电网运行优化技术及算例分析