博客专栏

EEPW首页 > 博客 > 决策智能技术浪潮袭来,数智商业领域如何变革?来听听三位专家怎么说(1)

决策智能技术浪潮袭来,数智商业领域如何变革?来听听三位专家怎么说(1)

发布人:机器之心 时间:2023-01-19 来源:工程师 发布文章

近年来,伴随着广告主的需求变化和相关技术发展,计算经济学理论、博弈论和人工智能技术被越来越多地应用到广告拍卖机制、投放策略中。


决策智能在商业场景中的意义逐渐凸显。用户看到的每一次商品展现、商家的每一次广告出价、平台的每一次流量分配,背后都有庞大且复杂的决策智能做支撑。


这些动作的目标在于优化用户购物体验,让广告投放的决策过程更加智能,同时让广告主、媒体在平台实现长期繁荣。广告主希望在有限的资源投入下最大化营销效果,平台希望能够建立更好的生态。然而流量环境、其他参竞广告形成的竞争环境的复杂性、以及广告投放策略中出价、目标人群、资源位、投放时间等变量的巨大组合复杂度,使得最优广告投放策略的计算与执行充满了挑战。


这些问题如何解决?效益最大化的目标具体如何分解?这些有关于决策智能的重要议题,也是领域内的研究者和从业者最关心的。


为了深入探讨「数智商业场景中的决策智能」这一主题,近日,阿里妈妈博见社联合机器之心,邀请到了北京大学邓小铁教授、中科院蔡少伟研究员和阿里妈妈 CTO 郑波老师三位领域内的资深学者和专家,展开了一系列主题分享。


以下为邓小铁教授、蔡少伟研究员、郑波老师的主题分享内容,机器之心在不改变原意的前提下进行了整理。


邓小铁教授:计算经济学的几个最新研究进展


我今天粗糙地介绍一下计算经济学,这是一个很有历史的研究领域,最早可以追溯到 1930 年。后来的计算经济学从另外一个角度出发,将经济学变成计算,之前的计算经济学就是通过计算做经济学研究,这次讲一讲其中的思路。


图片


我们从计算的角度来考虑经济学,有几个主要关键问题:首先是优化,机器学习都是优化,从中可以看到很多优化体系。优化之后,还有一个问题叫做均衡,以前我们做计算经济学是从计划经济的思路去做的,但当时也有一派是从世界****做发展中国家的发展,他们给发展中国家定计划,从优化投入产出的思路展开。从计算角度算均衡会是很困难的问题,所以出现了一个概念,叫做可计算的一般均衡(Computable general equilibrium)。


最近,我们也越来越多可以看到动力学系统,因为这个世界很多东西并不是均衡的状态,特别突出看到均衡的场景是在数字经济活动中,其中包括经济学层面的东西,比如定价。在数字经济中,每时每秒都可以看到交易数据和价格波动。我们可以清清楚楚看得数据的变化,而不是一年过去之后再把经济数据统计出来。


计算经济学的整个框架下还有很多东西。每一个经济主体都要优化,它们共同博弈的不动点即是均衡。平台也会博弈均衡这件事情,特别是互联网广告平台,做广告的人到平台上来,将广告要通过平台、媒体发放出去。对于媒体,要把广告位置提供出来,利用自身对某一类人群的吸引力。对于平台,要想的是如何将大家的兴趣更好地匹配。阿里妈妈作为国内最大的广告平台,同样面临着博弈均衡的问题,需要安排好各方面利益,以实现社会效益最大化,同时也实现机制设计最大收益。


图片


我们可以从三个角度来谈优化。


首先是经济智能体刻画的问题。很多机器学习的东西都写成优化的问题,比如怎样用机器学习的方法算出来制约的约束条件,包括有些环境中的约束条件。


在非完全信息下,有很多条件是未知的,原来的经济学考虑不了如此复杂的东西,比如博弈对手的效益函数是什么、博弈对手的策略空间是什么、博弈对手都有哪些,非完全信息也是非常重要的对经济活动的刻画。


很多假设可以刻画非完全信息,比如经济人知道对手的效益函数、约束以及其他各种信息。关于彼此的效益函数有一个 common knowledge:我们知道 distribution。但这个 distribution 怎么来的呢?这就走进入机器学习范畴:为什么 player 要告诉彼此、告诉我们它知道什么?针对这些,在计算角度上就有一些很合理的问题。


博弈动力学,这是计算经济学的第三步。从实体经济的经济学来讲,很多活动是经过了 6000 年演化发展过来的,是大家慢慢地博弈,直到均衡。在数字经济中,想一下子到达均衡会是很大的挑战。


广告平台优化是阿里妈妈在做的事情。我们讲了这么多难的计算任务,什么时候能够做好呢?在单参数的情况下,已有的理论能够支撑,但是多参数怎么做到,理论上还没有现成的定义。


很重要的一点是,整个经济学体系已经建好了,但经济学用到互联网中会产生一个很大的缺陷 —— 它是静态的。大家肯定知道,业界的事情不是静态的,比如说「双十一」大促会产生很多挑战,如何设计红包的价格,根据市场已知模型如何建立这些东西,这些成为了今天计算经济学重要的挑战:一是近似求解优化,一是均衡计划,一是平台竞争动力学。


图片


近似计算的难度很大,我们最多知道的均衡的解可以算到三分之一,最多是 33% 的错误率,跟最优相差 33%,所以均衡计算确实挺难的。自动设计方法论、隐藏对手模型学习,是这方面的框架,这里都是跟信息容量相关的东西。


图片


另外就是与市场上的未知对手博弈。我们要考虑至少两个 company,建立一个模型来设计它们之间的博弈,这里都是单调的,并不知道所有的信息。根据已知的信息看市场的波动、价格设计变化,我们基于此设计一个隐函数的优化模型,用机器学习方法做分析。


多方认知次序的先后给我们带来博弈的认知层次。近年来,一些研究讨论了很多一价拍卖为什么比二价拍卖好。Myerson 假设所有人知道所有人的价值分布,发展了一套最优拍卖理论,但我们实际上不知道公共知识。我们自己的研究是从另外一个角度来考虑的,出发点是没有先验的共同知识,把原来用的概率方法建立 Myerson 最优拍卖理论的假设放弃掉。


在没有这套拍卖均衡的基础假设的环境下,最优解可以如何实现均衡?可以发现,泛化一价拍卖收益是跟 Myerson 相等的。这里应对买家以最优效益为目标公布的价值分布,卖家设计的 Myerson 最优收益,等价于它已泛化一价拍卖的期望拍卖收益。


最终的结论是,Myerson 和 GFP 是等价的,它们要比 VCG 要好,但是在 IID 情况下是相等的,Symmetric BNE 和 GSP 也是等价的。


计算经济学用到的另外一个概念是马尔可夫博弈,一种在动态环境下的博弈,特别是无穷轮博弈求解的问题。我们对问题从三个方向进行了处理:一是为计算做了有理化的简化,把目标限制在近似解;二是用时间折现率保证无穷轮收益的收敛性;三是数学上的分阶段求以及将策略不同轮的变化局限在一轮的变化。如此,无穷求和的难点得以克服。


我们进一步在马尔可夫博弈的应用方面简化了计算的难度。对于比特币的共识机制的设计,有清晰的马尔可夫奖励分析,而且讲了一个很好的故事。按照机制设计规定,大多数人支持它就是对。但后面发现,大多数支持并不保证经济学上的安全,有四分之一的人通过自私挖矿攻击就可以推翻多数原则。


图片

远见挖矿策略:「螳螂捕蝉,黄雀在后」


对于数字经济设计环节的问题,我们最新的工作是可以用 Insightful mining Equilibrium 克服,用远见挖矿的策略实现最优,最后是马尔科夫博弈的构架,形成了马尔科夫奖励过程,增加一个认知层级,从诚实矿池、自私矿池,再越过一个层级,达到远见矿池的结果。


同样地,许多互联网公司要处理动态的东西而非静态的东西,如今世界经济学不再是以前的经济学,此外还通过数学使得机器学习方法论和博弈论紧密结合在了一起。我们因此克服了只能处理静态经济学的情形,演进到了能够处理动态的情形。


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

波段开关相关文章:波段开关原理




关键词: AI

相关推荐

技术专区

关闭