Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。从公司的角度来讲,可以提供一些数据,进而提出一个实际需要解决的问题;从参赛者的角度来讲,他们将组队参与项目,针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。
除此之外,Kaggle官方每年还会举办一次大规模的竞赛,奖金高达一百万美金,吸引了广大的数据科学爱好者参与其中。但是不同于传统的低层次劳动力需求,Kaggle一直致力于解决业界难题,因此也创造了一种全新的劳动力市场——不再以学历和工作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。
学员要求
建议学员对python有一定的基础,同时具备微积分和概率的基础知识
Kaggle竞赛题目
部分题目展示:
1.Two Sigma: Using News to Predict Stock Movements(Use news analytics to predict stock price performance)
2.Jigsaw Unintended Bias in Toxicity Classification(Detect toxicity across a diverse range of conversations)
3.Santander Customer Transaction Prediction(Can you identify who will make a transaction?)
课程大纲
(授课内容(可能根据学生接受程度在课程容量上有调整))
第一周-上午(2h)
1. 赛事入门讲解
Kaggle赛事介绍,过往案例分析
2. 基础培训
Python基础框架梳理、Machine Learning入门
第一周-下午(2h)
1. 基础培训
模型应用:Regression Methods、Perceptron、Logistic Regression、Neural Network
2. 比赛实战
当期比赛题目分析、实践
第二周-上午(2h)
1. 基础培训
模型应用:Regression Methods、Perceptron、Logistic Regression、Neural Network
第二周-下午(2h)
1. 比赛实战
往期比赛题目调试、提交