决策智能技术浪潮袭来，数智商业领域如何变革？来听听三位专家怎么说（1）

发布人：机器之心时间：2023-01-19 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

近年来，伴随着广告主的需求变化和相关技术发展，计算经济学理论、博弈论和人工智能技术被越来越多地应用到广告拍卖机制、投放策略中。

决策智能在商业场景中的意义逐渐凸显。用户看到的每一次商品展现、商家的每一次广告出价、平台的每一次流量分配，背后都有庞大且复杂的决策智能做支撑。

这些动作的目标在于优化用户购物体验，让广告投放的决策过程更加智能，同时让广告主、媒体在平台实现长期繁荣。广告主希望在有限的资源投入下最大化营销效果，平台希望能够建立更好的生态。然而流量环境、其他参竞广告形成的竞争环境的复杂性、以及广告投放策略中出价、目标人群、资源位、投放时间等变量的巨大组合复杂度，使得最优广告投放策略的计算与执行充满了挑战。

这些问题如何解决？效益最大化的目标具体如何分解？这些有关于决策智能的重要议题，也是领域内的研究者和从业者最关心的。

为了深入探讨「数智商业场景中的决策智能」这一主题，近日，阿里妈妈博见社联合机器之心，邀请到了北京大学邓小铁教授、中科院蔡少伟研究员和阿里妈妈 CTO 郑波老师三位领域内的资深学者和专家，展开了一系列主题分享。

以下为邓小铁教授、蔡少伟研究员、郑波老师的主题分享内容，机器之心在不改变原意的前提下进行了整理。

邓小铁教授：计算经济学的几个最新研究进展

我今天粗糙地介绍一下计算经济学，这是一个很有历史的研究领域，最早可以追溯到 1930 年。后来的计算经济学从另外一个角度出发，将经济学变成计算，之前的计算经济学就是通过计算做经济学研究，这次讲一讲其中的思路。

我们从计算的角度来考虑经济学，有几个主要关键问题：首先是优化，机器学习都是优化，从中可以看到很多优化体系。优化之后，还有一个问题叫做均衡，以前我们做计算经济学是从计划经济的思路去做的，但当时也有一派是从世界****做发展中国家的发展，他们给发展中国家定计划，从优化投入产出的思路展开。从计算角度算均衡会是很困难的问题，所以出现了一个概念，叫做可计算的一般均衡（Computable general equilibrium）。

最近，我们也越来越多可以看到动力学系统，因为这个世界很多东西并不是均衡的状态，特别突出看到均衡的场景是在数字经济活动中，其中包括经济学层面的东西，比如定价。在数字经济中，每时每秒都可以看到交易数据和价格波动。我们可以清清楚楚看得数据的变化，而不是一年过去之后再把经济数据统计出来。

计算经济学的整个框架下还有很多东西。每一个经济主体都要优化，它们共同博弈的不动点即是均衡。平台也会博弈均衡这件事情，特别是互联网广告平台，做广告的人到平台上来，将广告要通过平台、媒体发放出去。对于媒体，要把广告位置提供出来，利用自身对某一类人群的吸引力。对于平台，要想的是如何将大家的兴趣更好地匹配。阿里妈妈作为国内最大的广告平台，同样面临着博弈均衡的问题，需要安排好各方面利益，以实现社会效益最大化，同时也实现机制设计最大收益。

我们可以从三个角度来谈优化。

首先是经济智能体刻画的问题。很多机器学习的东西都写成优化的问题，比如怎样用机器学习的方法算出来制约的约束条件，包括有些环境中的约束条件。

在非完全信息下，有很多条件是未知的，原来的经济学考虑不了如此复杂的东西，比如博弈对手的效益函数是什么、博弈对手的策略空间是什么、博弈对手都有哪些，非完全信息也是非常重要的对经济活动的刻画。

很多假设可以刻画非完全信息，比如经济人知道对手的效益函数、约束以及其他各种信息。关于彼此的效益函数有一个 common knowledge：我们知道 distribution。但这个 distribution 怎么来的呢？这就走进入机器学习范畴：为什么 player 要告诉彼此、告诉我们它知道什么？针对这些，在计算角度上就有一些很合理的问题。

博弈动力学，这是计算经济学的第三步。从实体经济的经济学来讲，很多活动是经过了 6000 年演化发展过来的，是大家慢慢地博弈，直到均衡。在数字经济中，想一下子到达均衡会是很大的挑战。

广告平台优化是阿里妈妈在做的事情。我们讲了这么多难的计算任务，什么时候能够做好呢？在单参数的情况下，已有的理论能够支撑，但是多参数怎么做到，理论上还没有现成的定义。

很重要的一点是，整个经济学体系已经建好了，但经济学用到互联网中会产生一个很大的缺陷 —— 它是静态的。大家肯定知道，业界的事情不是静态的，比如说「双十一」大促会产生很多挑战，如何设计红包的价格，根据市场已知模型如何建立这些东西，这些成为了今天计算经济学重要的挑战：一是近似求解优化，一是均衡计划，一是平台竞争动力学。

近似计算的难度很大，我们最多知道的均衡的解可以算到三分之一，最多是 33% 的错误率，跟最优相差 33%，所以均衡计算确实挺难的。自动设计方法论、隐藏对手模型学习，是这方面的框架，这里都是跟信息容量相关的东西。

另外就是与市场上的未知对手博弈。我们要考虑至少两个 company，建立一个模型来设计它们之间的博弈，这里都是单调的，并不知道所有的信息。根据已知的信息看市场的波动、价格设计变化，我们基于此设计一个隐函数的优化模型，用机器学习方法做分析。

多方认知次序的先后给我们带来博弈的认知层次。近年来，一些研究讨论了很多一价拍卖为什么比二价拍卖好。Myerson 假设所有人知道所有人的价值分布，发展了一套最优拍卖理论，但我们实际上不知道公共知识。我们自己的研究是从另外一个角度来考虑的，出发点是没有先验的共同知识，把原来用的概率方法建立 Myerson 最优拍卖理论的假设放弃掉。

在没有这套拍卖均衡的基础假设的环境下，最优解可以如何实现均衡？可以发现，泛化一价拍卖收益是跟 Myerson 相等的。这里应对买家以最优效益为目标公布的价值分布，卖家设计的 Myerson 最优收益，等价于它已泛化一价拍卖的期望拍卖收益。

最终的结论是，Myerson 和 GFP 是等价的，它们要比 VCG 要好，但是在 IID 情况下是相等的，Symmetric BNE 和 GSP 也是等价的。

计算经济学用到的另外一个概念是马尔可夫博弈，一种在动态环境下的博弈，特别是无穷轮博弈求解的问题。我们对问题从三个方向进行了处理：一是为计算做了有理化的简化，把目标限制在近似解；二是用时间折现率保证无穷轮收益的收敛性；三是数学上的分阶段求以及将策略不同轮的变化局限在一轮的变化。如此，无穷求和的难点得以克服。

我们进一步在马尔可夫博弈的应用方面简化了计算的难度。对于比特币的共识机制的设计，有清晰的马尔可夫奖励分析，而且讲了一个很好的故事。按照机制设计规定，大多数人支持它就是对。但后面发现，大多数支持并不保证经济学上的安全，有四分之一的人通过自私挖矿攻击就可以推翻多数原则。