logo

【学风建设宣传月】软件学院《Reinforcement Learning vs. Optimal Control》线上讲座顺利举办

  • 软件学院
  • 信息与软件工程学院(示范性软件学院)
  • 2022-11-07 09:30:48
  • 828 次阅读

11月2日上午,信息与软件工程学院邀请到来自加拿大阿尔伯塔大学的LI YUXI博士为学生做题为《Reinforcement Learning vs. Optimal Control》的线上讲座,探讨和讲解强化学习与优化控制之间的关系,对强化学习在连续控制中的应用做了较为深入的介绍。

LI YUXI博士首先讲解了强化学习及优化控制的基础知识。他介绍到,基于智能体与环境交换的基础的强化学习架构主要包含以下几个流程:接收状态、选择智能体执行的动作、获取该动作对应的收益、转换到下一个状态,在即时或者长时间序列下更新动作选择的策略以实现最大化收益的优化目标。随后,LI YUXI博士以一张直观的关系图介绍了强化学习和优化控制与各个学科之间的联系,让同学们直观地看到两者之间存在的紧密关联,强化学习涉及到机器学习、反馈系统、博弈论、控制论等。最后,LI YUXI博士对于智能决策器常规模型的探索及其架构进行了介绍。

相关链接:

LI YUXI,加拿⼤阿尔伯塔大学计算机科学博士。在arXiv上发表《深度强化学习综述》,获900余次引用。近期在arXiv上发表《深度强化学习:机遇与挑战》Deep Reinforcement Learning: Opportunities and Challenges。两次担任Machine Learning Journal特刊客座主编, 领衔组织ICML 2019、2021 workshops,在NeurIPS、AIStats、INFOCOM等发表多篇论文,多次担任AAAI 2019-2022,ACM Computing Surveys, Communications of ACM, PAMI, TKDD等审稿员。在加拿⼤创办⼈工智能公司attain.ai。