目前,国际知名学术期刊“SIAM Journal on Control and Optimization”(美国工业与应用数学会-控制与最优化杂志)在线发表了深圳大学数学与统计学院助理教授王寒霄与南方科技大学助理教授孙景瑞、温家强合作的学术论文“Zero-SumStackelberg Stochastic Linear-Quadratic Differential Games”。
微分对策的历史可追溯至上世纪50年代美国数学家R. Isaacs和前苏联数学家L. S. Pontryagin对追逃对策的研究。1965年,R. Isaacs整理出版了微分对策领域的第一部著作, 这标志着微分对策的正式诞生。1994年,美国数学家 J. F. Nash 因对非合作对策的贡献而获得诺贝尔奖。这使得微分对策的研究焕发了巨大的生机,并被广泛应用于经济学、军事理论、社会学和机器学习等领域。
作为最重要的特殊形式,线性二次问题一直牢牢占据对策论(或控制论)研究的核心位置。根据博弈者关系的不同,通常可分为Nash对策和Stackelberg对策,其中Stackelberg对策又被称为主从对策(leader-follower games)。在Nash对策中,两位博弈者为纯竞争关系,二人地位对等,致力于寻找Nash均衡。在Stackelberg对策中,两位博弈者是既竞争又合作关系,二人存在主从结构,一位是决策者(leader),一位是执行者(follower),致力于寻找Stackelberg均衡。在这篇文章中,王寒霄与其合作者系统研究了零和情形下的线性二次随机Stackelberg对策问题。文章发现了Stackelberg对策在零和与非零和情形下的本质不同。利用此发现,将决策者面临的问题转化为一个倒向随机微分方程驱动的线性二次最优控制问题。引入弱一致凸凹条件,证明了对应Riccati方程的适定性,得到了Stackelberg均衡的闭环表示。另外,文章发现在非常一般的条件下,所得的Stackelberg均衡恰好也是一个Nash均衡。这在线性二次框架下,揭示了Stackelberg对策和Nash对策的关系,同时也给出了求解Nash对策的新方法。
王寒霄,2014-2020年在复旦大学太阳集团官网就读,获博士学位,现任深圳大学数学与统计学院助理教授,主要研究领域是随机控制和随机微分方程。
全文链接:https://epubs.siam.org/doi/10.1137/21M1450458