学院公告+

学院公告

【讲座预告】北京大学光华管理学院副教授彭一杰:智能系统训练的新方法

发布时间:2022-08-30

麓山数字传媒与人文学术论坛第7讲

演讲主题智能系统训练的新方法

彭一杰,北京大学光华管理学院副教授

 剑,数字传媒与人文学院执行院长

活动时间2022年830日(星期二)14:30-15:30

活动地点:经管楼1815会议室

主讲人简介:

北京大学光华管理学院副教授,博士生导师。北京大学人工智能研究院、国家健康医疗大数据研究院兼职研究员。本科毕业于武汉大学数学与统计学院,从复旦大学管理学院获博士学位。在美国马里兰大学和乔治梅森大学分别从事过博士后与助理教授工作。主要研究方向包括仿真建模与优化、金融工程与风险管理、人工智能、健康医疗等。主持多项科研基金项目,包括国家优秀青年科学基金项目,国家青年科学基金项目,北京市青年骨干个人项目等。在《Operations Research》,《INFORMS Journal on Computing》和《IEEE Transactions on Automatic Control》等高质量期刊上发表学术论文20余篇。曾获得2019年INFORMS Outstanding Simulation Publication Award,2020年Winter Simulation Conference Best Theory Paper Finalist,2017年IEEE Robotics and Automatic Society Best Paper Award Finalist。目前担任Asia-Pacific Journal of Operational Research、《系统管理学报》、IEEE Control Systems Society 会议编委,中国运筹学会金融工程与金融风险管理分会常务理事,中国仿真协会人工社会专委会委员,中国人工智能协会社会计算分会理事,中国管理现代化研究会风险管理专业委员会委员,北京运筹学会副秘书长。

活动简介:

智能系统训练的新方法。深度学习和强化学习是人工智能中的关键技术。神经网络是深度学习中强大的函数逼近器。训练神经网络是深度学习技术成功应用的关键。随机梯度搜索算法是神经网络训练的标准方法,其中最常用的梯度估计方法是反向传递算法,它具有很高的计算效率。但反向传递算法不能训练具有不连续激发函数与损失函数的神经网络;反向传递算法受梯度消失问题困扰,从而会造成神经网络训练缓慢,甚至停止训练;反向传递算法训练的神经网络在对抗攻击下脆弱。新方法可以训练不连续神经网络,避免梯度消失问题,提高识别鲁棒性。经典的强化学习问题的目标是在动态环境下给出最优策略极大化累加期望回报,策略梯度法是在给定参数族中搜寻最优策略的有效方法。为了让智能系统在极端事件下的决策表现更稳健,新方法以扭曲风险度量为目标函数的强化学习,把行为特征融入智能系统训练。