本期项目回顾
我们将带你“云体验”为期七周的线上科研项目,跟随大牛教授学习,在博士导师的辅导下,完成科研课题并撰写科研论文的全过程。
本期课题:
#01 项目介绍
项目介绍:
项目内容涉及强化学习核心理论和技能,具体包括遗传算法、强化学习框架、Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程、优化控制、图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。学生通过项目了解如何开发基于强化学习的生产力软件,在结束时提交项目个性化研究课题报告,进行成果展示。
个性化研究课题参考:
·强化学习在博弈论中的应用:类alpha算法开发
·利用经验留存解决强化学习所需样本太多问题的可行性分析
·强化学习中的机器奖励设置方法迭代
·为强化学习过拟合的特定场景重新建模的自动过程研究
·具有精确尺度估计的动作-评价网络结构与强化学习优势函数
项目大纲:
·强化学习:项目将在本周聚焦遗传算法和强化学习框架。
·环境:强化学习由智能体和环境两部分构成。项目将在本周探讨离策略、无模型强化学习算法 Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程等。Environment
·优化:项目将在本周深入学习强化学习与优化控制。
·集成与控制
·集成:项目将在本周进一步探讨图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。
·项目回顾与成果展示
·论文辅导
#02 导师介绍
导师:Pietro
剑桥大学 终身正教授
Pietro导师现任剑桥大学计算机科学与技术终身正教授,意大利国家认定Top100科学家, H-index64,被引用次数35000+。教授2021年连中三篇计算机顶会ICML,其论文还曾发表在包括世界级学术期刊 《Nature》。导师持有欧洲学习和智能系统实验室(Ellis;欧洲大型跨国人工智能研究所,目前拥有千位全球顶尖计算机工程师、数学家和其他领域科学家,旨在重构欧洲人工智能前沿研究)席位、剑桥大学大数据研究指导委员会席位。
#03 项目进行中
导师、副导师与助教的教学以及班主任的全程陪伴,充分保证学员的项目学习过程以及体验,提高项目学习的效果。
课堂截图
#04 项目成果展示
在科研小组成员的共同努力以及导师和班主任团队的指导帮助下,学员将自主完成完整的项目,并最终向导师进行汇报。
成果展示
同时,在写作课程结束后,论文老师将安排论文课。配合论文辅导团队的指导,学生将会把小组的科研成果进一步精细打磨,形成高质量的科研成果产出。
作业展示
#05 学员反馈
班主任沟通截图
助教老师解答问题
助教回答
助教回答
学员反馈