中国精算研究院

精算论坛讲座第232期—韩霞(11月16日)

发布时间:2023-11-10 14:10    浏览次数:[]

教育部人文社科重点研究基地中央财经大学中国精算研究院学术活动

精算论坛讲座第232期

(2023年11月16日)

徽标, 公司名称描述已自动生成

讲座题目:Choquet regularization for reinforcement learning and its application

讲座摘要:We propose Choquet regularizers to measure and manage the level of exploration for reinforcement learning (RL), and reformulate the continuous-time entropy-regularized RL problem of Wang et al. (2020, JMLR, 21(198), 1-34) in which we replace the differential entropy used for regularization with a Choquet regularizer. Under the linear-quadratic setting, we derive explicit optimal distributions for several specific Choquet regularizers, and conversely identify the Choquet regularizers that generate a number of broadly used exploratory samplers such as -greedy, exponential, uniform and Gaussian. We further design a RL algorithm to solve the exploratory mean-variance problem and test our RL algorithm via simulation.

报告人简介:韩霞

南开大学数学科学学院概率统计系讲师,2020年7月获得南京师范大学统计学博士学位;2020年9月至2022年8月在加拿大滑铁卢大学精算与统计系从事两年博士后工作。主要研究方向为随机最优控制在金融保险市场中的应用、风险度量。在《Scandinavian Actuarial Journal》、《Insurance: Mathematics and Economics》、《SIAM Journal on Control and Optimization》《Mathematical Finance》期刊发表学术论文。

讲座时间:2023年11月16日 下午14:00-15:30

报告地点沙河校区13号学院楼209

邀 请 人:刘敬真

欢迎各位老师和同学积极参加!