党委学生工作部
Contact联系我们
- 联系邮箱:wjb@uestc.edu.cn
- 联系方式请点击 各部门联系方式
- 联系地址:四川省成都市高新西区西源大道2006号
- 电子科技大学(清水河校区)学生活动中心
LI YUXI博士首先讲解了强化学习及优化控制的基础知识。他介绍到,基于智能体与环境交换的基础的强化学习架构主要包含以下几个流程:接收状态、选择智能体执行的动作、获取该动作对应的收益、转换到下一个状态,在即时或者长时间序列下更新动作选择的策略以实现最大化收益的优化目标。随后,LI YUXI博士以一张直观的关系图介绍了强化学习和优化控制与各个学科之间的联系,让同学们直观地看到两者之间存在的紧密关联,强化学习涉及到机器学习、反馈系统、博弈论、控制论等。最后,LI YUXI博士对于智能决策器常规模型的探索及其架构进行了介绍。
相关链接:
LI YUXI,加拿⼤阿尔伯塔大学计算机科学博士。在arXiv上发表《深度强化学习综述》,获900余次引用。近期在arXiv上发表《深度强化学习:机遇与挑战》Deep Reinforcement Learning: Opportunities and Challenges。两次担任Machine Learning Journal特刊客座主编, 领衔组织ICML 2019、2021 workshops,在NeurIPS、AIStats、INFOCOM等发表多篇论文,多次担任AAAI 2019-2022,ACM Computing Surveys, Communications of ACM, PAMI, TKDD等审稿员。在加拿⼤创办⼈工智能公司attain.ai。