本文是 ICML 2023 入选论文 Coordinated Dynamic Bidding in Repeated Second-Price Auctions with Budgets 的解读。该论文由北京大学研究经济学实验室和华为 TCS Lab 协作共同完成。本文建议了在有预算料理的访佛二价拍卖中的在线协同竞价算法葬送的芙莉莲 动漫,从表面和实验的角度考证了协同竞价如实不错让每个玩家王人拿到比单独竞价更好的收益,并分析了算法优良的博弈性质。
葬送的芙莉莲 动漫
论文相连:https://proceedings.mlr.press/v202/chen23ac.html
01 引 言
在在线告白市集中,告白商通过参与在线告白位拍卖来赢得告白位及展示告白的契机。本质场景中,他们频频会参与多轮拍卖,有预算戒指,并眷注荟萃效益。参与这种访佛拍卖的告白商所面对的是在线决策问题:他们无法获知行将到来的流量价值和可能的蹂躏,必须笔据历史信息决定出价,以最大化我方的荟萃效益。
最近,越来越多的告白商开动使用告白平台或第三方竞价机构提供的自动竞价处事。告白商告诉竞价代理他们的预算戒指,代理缱绻知足预算料理的在线竞价算法,来最大化客户的荟萃效益。天然大大宗现存的在线竞价算法征询王人研究在为一个竞价者缱绻竞价算法,可是,竞价代理频频同期领有他所有客户的信息,从而有机和会过协同竞价来提高每个客户的服从。
本文的方案是回话在线拍卖场景中协同竞价的基本问题:咱们是否不错缱绻一个协同的在线竞价战略,使得每个告白商客户的服从王人高于他们在零丁竞价下所能赢得的最好服从?
在本文中,咱们征询了具有预算戒指的访佛二价拍卖中的竞价协同问题。具体的:
咱们建议了知足预算料理的在线协同竞价算法,从表面和实验两方面保证了每个客户王人能赢得比其在零丁竞价下所能赢得的最好服从更高的服从。此外,咱们还对所建议的算法在对称情况下进行了平衡时博弈性质的分析:最初,咱们阐发了咱们的算法是所有知足预算料理的协同竞价算法中最大化定约福利的算法(即玩家服从和)。其次,咱们阐发了在咱们的其中一个算法下,莫得玩家不错通过谎报预算料理来赢利。
02 难 点
为了赢得专门旨的表面效果,在线拍卖的协同竞价问题主要的难点在于竞价者在动态访佛环境中的互相影响。因为拍卖是多东说念主博弈,一个竞价者的服从受到其他东说念主出价的影响。这么的多维动态分析是比拟繁重的。
此外,咱们本色上是在比拟每个竞价者的服从与其零丁竞价时能赢得的最好服从,因此咱们需要进行多基线而非单基线的比拟。
好像有东说念主会发现,萝莉社区允许竞价者之间进行货币滚动不错简化问题,因为在这种情况下,算法缱绻只需要最大化定约福利。但咱们以为这是辨认理的,因为竞价者过问拍卖,为的是扩大居品的影响力,赢得更多的告白位展示的契机,而非只是专揽拍卖进行金融投资来径直赢得财富的利益。
03 基 线
研究每个东说念主王人零丁使用 Balseiro et al'19[1]建议的 adaptive pacing 算法的情况。作为一种协同竞价算法的特例,咱们将其缩写为 IP(Individual Adaptive Pacing)。Balseiro et al'19[1]阐发了该单东说念主算法在立时和颓唐环境下的最优性。况且,当玩家们的每轮守望蹂躏知足强单调性时,不错阐发每个玩家的平均战略及收益拘谨到某个系统平衡。咱们将其作为咱们本论文的基线用于与咱们我方建议的算法进行比拟。同期,每轮守望蹂躏函数的强单调性将是咱们论文的主要假定。
04 技 术
为了克服这些繁重,咱们最初标明,存在一种最优的协同竞价算法,在每一轮中只聘请一个代表进行竞价,其他成员竞价为0。这么不错镌汰到手者的蹂躏,从而提高她单轮的服从。因此,竞价算法缱绻问题就解析为了缱绻一个平正的划定来聘请代表进行竞价以及一个精雅的预算处分战略。咱们将使用单东说念主的 adaptive pacing 来作为预算处分战略。而如何缱绻代表聘请的划定,使每个玩家王人有充足的契机参与信得过拍卖,是一个尤为攻击的问题。
其次,强单调性假定确保了竞价者在使用协同竞价算法时的平均服从拘谨,这进一步允许咱们将对算法与基线的比拟简化为在两个平衡下每个玩家服从的比拟。更攻击的是,这种平衡分析的简化使咱们能够在对称情况下对算法的博弈性质进行一些表面分析。
05 两种算法的简介
一种最为天然简便的算法是对 IP 的径直延长,介意到每个玩家在 IP 算法下的参数和战略更新只跟我方历史的蹂躏和赢得价值关连,咱们径直将每次竞价最高的玩家选为代表过问信得过的拍卖,将其他东说念主的竞价抹平,并专揽得到的蹂躏和价值来更新参数。咱们称该算法为 Coordinated Pacing(CP)。CP 的方式较为爽脆,易于分析。不错阐发在对称情况下,它能使得每个玩家的收益王人比零丁竞价时要高,同期当其他东说念主王人素质论说我方的预算料理的工夫,莫得玩家能够通过报低我方的预算料理来赢得更高的平衡收益。关联词,这么简便的竞价代表聘请划定在一般情况下并不是“平正”的。存在不对称的例子,使得一个玩家始终也莫得契机赢得物品,而另一个玩家会一直赢的物品。
咱们建议的第二种算法,Hybrid Coordinated Pacing(HP),将里面竞选和外部竞价分开来。通过模拟一个里面的拍卖来提高竞价代表聘请的平正性。具体的,咱们让里面拍卖的参数更新和拍卖效果模拟 IP 下的效果,让每个玩家王人有充足的契机去过问外部的竞争。同期,因为每个东说念主单轮的蹂躏更少了,他们历久的平均收益就进步了。关联词,因为该算法较为复杂,咱们将玩家在该算法是否有动机谎报预四肢为一个将来可探索的场地。
值得介意的是,咱们找到了一个数值反例,其中的玩家在 IP 算法下有动机谎报我方的预算来进步服从。
06 总 结
本文建议了两个在有预算料理的访佛二价拍卖中的在线协同竞价算法,并从表面和实验的角度考证了战略所具备的优良性质。同期,本文指出了好多可延长拓展的场地,举例:
1. 如何更好地描摹和研究定约以外的东说念主关于定约的存在产生的反馈;
2. 如何更合理地界说协同算法对定约成员的平正性;
素人播播3. 如何将目下的在线竞价算法应用于本色告白拍卖,或是与机器学习联接缱绻基于学习的竞价算法。
参考文件:
[1] Balseiro葬送的芙莉莲 动漫, S. R. and Gur, Y. Learning in repeated auctions with budgets: Regret minimization and equilibrium. Management Science, 2019.