CMU数据科学与统计学科研专题:“横行赌场” 基于统计分析原理的不确定性过程决策分析

招生状态:招生中

开课时间:2023-5-20

课时安排:7周在线小组科研+5周论文辅导,教授全程参与

适合专业

项目适合人工智能、数据科学、统计学等专业学生。

学生需要具备微积分、概率论与数理统计基础,同时会使用Python编程语言。

项目收获

1. 7周在线小组科研学习+5周论文指导学习 共125课时

2. 学术报告

3. 优秀学员获主导师Reference Letter

4. EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)

5. 结业证书

6. 成绩单

项目介绍

“多臂强盗”问题是概率论中的一个经典问题,亦是深度强化学习中的重要模块。人们针对解决此类不确定性序列决策问题,提出了“多臂强盗”算法框架。

近年来这一算法框架因优异的性能和较少的反馈学习等优点,在推荐系统、信息检索到医疗保健和金融投资等诸多应用领域中受到了广泛关注。本课题正是以此框架为核心内容,学生将在参与的过程中深入了解算法的基础模型及应用,将认识到被广泛使用的上置信界算法(Upper Confidence Bound,简称UCB)及汤普森采样算法(Thompson Sampling Algorithms)。

导师还将讲授自身在该领域的最新研究成果。

项目大纲

多臂强盗问题的基础介绍

随机多臂强盗模型

上置信界(UCB)算法

贝叶斯强盗策略与汤普森采样算法

算法应用于实施,算法性能分析

多臂强盗算法在推荐系统中的应用

学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路

学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出

项目成果展示

论文指导

导师介绍

OsmanCMU计算机科学学院终身正教授

Osman教授现任是卡内基梅隆大学(CMU)计算机科学学院的终身正教授。此前他是CMU CyLab的博士后研究员,2011年秋季他还在亚利桑那州立大学担任访问博士后学者,后于2011年获得马里兰大学的电气和计算机工程博士学位。

研究重点是计算系统的建模、分析和性能优化,并使用应用概率、网络科学、数据科学和机器学习的工具。在数据科学和机器学习的背景下,他正在研究使用顺序样本(例如,多臂机器人)的统计推断和决策,以及弹性分布式机器学习。

在网络科学方面,他有广泛的兴趣,包括网络物理系统的健壮性,重点关注关键基础设施系统、安全可靠的大规模自组织网络设计、日益关注物联网的新兴应用、以及复杂网络中的传染过程,重点关注病毒、(错误)信息和意见传播的建模、分析和控制。同时,还是IEEE的高级成员,CIT院长早期职业奖学金获得者,IBM学术奖获得者,以及ICC 2021和IPSN 2022的最佳论文奖获得者。

【竞赛报名/项目咨询请加微信:mollywei007】

上一篇

5.13大陆雅思大作文7分范文及解析:名人因魅力和财富出名造成的影响

下一篇

从零开始的英国本科申请攻略

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部
Baidu
map