2026年4月16日下午,中央财经大学中国精算研究院在沙河校区学院楼13号楼209教室顺利举办第283期精算论坛。本期论坛特邀香港理工大学戴民教授和南开大学南开-泰康保险与精算研究院赵慧教授,分别以“基于随机化Dynkin博弈的带有交易成本的最优投资策略学习”“模型不确定性下带有定期绩效评估的投资组合选择问题”为题,带来精彩的报告。本次论坛由刘敬真老师主持,吸引了众多师生踊跃参与,展现了金融数学、随机控制与强化学习交叉研究的前沿活力。

戴民教授在作报告
第一场报告中,戴民教授探讨了交易成本与模型不确定性的难题,提出了一种全新的连续时间强化学习模式,通过“随机化Dynkin博弈”在未知市场环境下学习带交易成本的最优投资策略。他指出,传统模型往往假设市场参数已知且无摩擦,而现实投资者必须面对成本与未知动态,戴教授的团队将这一问题转化为Dynkin博弈,这一转化源于Dai和Yi(2019)的经典结果,使得原本复杂的奇异控制问题变得可解。当市场参数未知时,进一步引入随机化停止时间与熵正则化,形成“随机化Dynkin博弈”。基于这一框架,团队发展出一种可解释的强化学习算法,能够在无需知道模型参数的情况下,直接从市场数据中学习接近最优的交易策略。理论分析提供了收敛性保证,并且在模拟与真实市场实证测试中,该方法有效逼近最优交易边界,显著优于多种基准策略。这项研究架起了随机控制与现代机器学习之间的桥梁,为动态投资组合管理提供了实用且可操作的工具。

赵慧教授在作报告
第二场报告中,赵慧教授聚焦于基金管理中的核心矛盾,提出了一种新的投资组合选择模型,同时引入模型不确定性与定期绩效评估。在该模型中,基金经理连续制定投资策略,但其绩效在若干离散时间点被评估,评估的标准为当前财富与某一基准的比值。此外,模型还引入评估成本函数,用于在确定评估周期时权衡成本与收益。通过动态规划原理,赵教授将原始问题转化为一个辅助的单期优化问题,并据此求得最优投资策略与对应的值函数,数值模拟结果表明:评估成本越高,最优评估周期越长,值函数越低。这一研究为基金公司设计更科学、更具激励相容性的绩效考核制度提供了理论支撑。

参会人员合照
本次精算论坛内容前沿、逻辑严谨,为师生提供了宝贵的学术交流平台,两场报告分别从投资者的交易策略学习与基金管理绩效评估机制的两个角度,回应了当前金融决策者的难题,共同展现了金融数学与强化学习、模型不确定性等前沿领域的融合。与会师生热烈讨论,认为相关研究对提升行业的科学决策水平具有积极的推动作用,并期待更多研究能为实务操作提供理论依据。
(撰稿:周笑;审稿:刘敬真、王庆焕;编辑:薛丽娜;审核:马冰)