课程特色:
1、精选kaggle初级案例,实战入门讲解。一步一脚印,十大案例精讲,案例知识点与代码交互讲解,让你快速突破R语言。
2、实战案例是最好的数据能力提升方式,本课程提供案例的数据集、代码以及老师讲解的PPT。
3、kaggle竞赛案例包含大量日常工作中的数据处理的方法,以及数据可视化的方法,助你突破数据工作的效率,对于数据处理、可视化、建模和模型评估有综合性显著性的提升,全方位的提升你的数据能力!
4、结合数据分析师的日常数据处理,建模的工作内容所需,融会贯通,通过案例教你如何成为一名数据分析师。
5、多种建模方法(随机森林、决策树、朴素贝叶斯、knn、支持向量机、 k均值聚类,模型融合方法等都有讲到,部分涉及原理简介)
讲师简介:
邬书豪 车联网数据挖掘攻城狮,做过数据建模项目,打过数据科学比赛。参与过的数据建模项目包括中国中车、东风集团、上汽通用、上汽大通等公司。
致力于成为一名热爱数据从数据出发解决实际问题的数据科学家。
课程大纲:
第一章:员工离职预测
数据变量说明
描述性分析(一)
描述性分析(二)
决策树建模
朴素贝叶斯建模
模型评估与应用
第二章:kaggle数据科学社区调查报告
变量说明
数据预处理
数据科学从业者用户画像1
数据科学从业者用户画像2
数据科学从业者用户画像3
数据科学从业者用户画像4
数据科学从业者用户画像5
python、R、SQL推荐程度分析
第三章:信用卡欺诈预测
案例数据介绍
数据预处理之缺失值处理
数据预处理之分层抽样
数据预处理之标准化
描述性分析1
描述性分析2
简单调参
定制调参
随机森林建模
knn建模
模型评估
第四章:学生成绩水平分类预测
案例变量说明
封装绘图函数
描述性分析1
描述性分析2
描述性分析3
回归树建模
随机森林建模
支持向量机建模
模型融合
第五章:美国枪击案例
案例数据变量说明
描述性分析1
枪手用户画像
美国枪击案地图可视化
常用图形外观调节
常用数据重塑函数总结1
常用数据重塑函数总结2
第六章:毒蘑菇识别
案例变量说明
数据预处理
朴素贝叶斯简介
特征选择
朴素贝叶斯建模
回归树建模+可视化决策规则
随机森林建模
模型评估
第七章:利用声音数据识别性别
案例变量说明
描述性分析
模型对比
回归树建模
支持向量机建模
规则学习建模
随机森林建模
封装法特征选取+随机森林建模
模型评估
混淆矩阵、ROC
第八章:垃圾短信识别
案例变量说明
数据重塑
文本处理
绘制词云图
随机森林建模预测
总数据建模预测
重塑数据建模预测
模型评估
第九章:闪电约会
案例背景介绍+变量说明
探索相亲者的年龄分布分析
探索哪些爱好更受彼此赞同分析
探索哪些领域的人更受欢迎分析
探索相亲者的心仪对象的特点分析
图形输出总结
深入浅出ggplot2包条形图总结
深入浅出ggplot2包箱线图总结
第十章: Youtube新趋势视频分析
案例变量说明
探索哪些视频更受欢迎
探索观看人数与点赞人数的关系
探索观看人数与累积评论数的关系
探索不同国家视频的受欢迎状况
探索不同国家发布的视频种类
对视频数据系谱聚类
k均值聚类原理
评论0