课程简介
课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些Python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。
课程目录
│ ├<01-python科学计算库-numpy>
│ │ ├课时01.课程介绍(主题与大纲)
│ │ ├课时02.机器学习概述
│ │ ├课时03.使用Anaconda安装python环境.flv
│ │ ├课时04.课程数据,代码,PPT(在参考资料界面)
│ │ ├课时05.科学计算库Numpy.flv
│ │ ├课时06.Numpy基础结构.flv
│ │ ├课时07.Numpy矩阵基础
│ ├课时08.Numpy常用函数
│ ├课时09.矩阵常用操作
│ └课时10.不同复制操作对比
├<02-python数据分析处理库-pandas>
│ │ ├课时11.Pandas数据读取.flv
│ │ ├课时12.Pandas索引与计算
│ ├课时13.Pandas数据预处理实例
│ ├课时14.Pandas常用预处理方法
│ ├课时15.Pandas自定义函数
│ └课时16.Series结构
├<03-python数据可视化库-matplotlib>
│ │ ├课时17.折线图绘制.flv
│ │ ├课时18.子图操作
│ ├课时19.条形图与散点图
│ ├课时20.柱形图与盒图
│ └课时21.细节设置
├<04-python可视化库seaborn>
│ │ ├课时22.Seaborn简介.flv
│ │ ├课时23.整体布局风格设置
│ ├课时24.风格细节设置
│ ├课时25.调色板
│ ├课时26.调色板
│ ├课时27.调色板颜色设置
│ ├课时28.单变量分析绘图
│ ├课时29.回归分析绘图
│ ├课时30.多变量分析绘图
│ ├课时31.分类属性绘图
│ ├课时32.Facetgrid使用方法
│ └课时33.Facetgrid绘制多变量
├<05-回归算法>
│ │ ├课时34.热度图绘制
│ ├课时35.回归算法综述
│ ├课时36.回归误差原理推导
│ ├课时37.回归算法如何得出最优解
│ ├课时38.基于公式推导完成简易线性回归
│ └课时39.逻辑回归与梯度下降
├<06-决策树>
│ │ ├课时40.使用梯度下降求解回归问题
│ ├课时41.决策树算法综述
│ ├课时42.决策树熵原理
│ ├课时43.决策树构造实例
│ ├课时44.信息增益原理
│ ├课时45.信息增益率的作用
│ ├课时46.决策树剪枝策略
│ └课时47.随机森林模型
├<07-贝叶斯算法>
│ │ ├课时48.决策树参数详解
│ ├课时49.贝叶斯算法概述
│ ├课时50.贝叶斯推导实例
│ ├课时51.贝叶斯拼写纠错实例
│ └课时52.垃圾邮件过滤实例
├<08-支持向量机>
│ │ ├课时53.贝叶斯实现拼写检查器
│ ├课时54.支持向量机要解决的问题
│ ├课时55.支持向量机目标函数
│ ├课时56.支持向量机目标函数求解
│ ├课时57.支持向量机求解实例
│ ├课时58.支持向量机软间隔问题
│ └课时59.支持向量核变换
├<09-神经网络>
│ │ ├课时60.SMO算法求解支持向量机
│ ├课时61.初识神经网络
│ ├课时62.计算机视觉所面临的挑战
│ ├课时63.K近邻尝试图像分类
│ ├课时64.超参数的作用
│ ├课时65.线性分类原理
│ ├课时66.神经网络-损失函数
│ ├课时67.神经网络-正则化惩罚项
│ ├课时68.神经网络-softmax分类器
│ ├课时69.神经网络-最优化形象解读
│ ├课时70.神经网络-梯度下降细节问题
│ ├课时71.神经网络-反向传播
│ ├课时72.神经网络架构
│ ├课时73.神经网络实例演示
│ └课时74.神经网络过拟合解决方案
├<10-xgboost集成算法>
│ │ ├课时75.感受神经网络的强大
│ ├课时76.集成算法思想
│ ├课时77.xgboost基本原理
│ ├课时78.xgboost目标函数推导
│ ├课时79.xgboost求解实例
│ ├课时80.xgboost安装
│ └课时81.xgboost实战演示
├<11-自然语言处理词向量模型-word2vec>
│ │ ├课时82.Adaboost算法概述
│ ├课时83.自然语言处理与深度学习加微信ff1318860
│ ├课时84.语言模型
│ ├课时85.-N-gram模型
│ ├课时86.词向量
│ ├课时87.神经网络模型
│ ├课时88.Hierarchical.Softmax
│ ├课时89.CBOW模型实例
│ ├课时90.CBOW求解目标
│ └课时91.梯度上升求解
├<12-k近邻与聚类>
│ │ ├课时92.负采样模型
│ ├课时93.无监督聚类问题
│ ├课时94.聚类结果与离群点分析
│ ├课时95.K-means聚类案例对NBA球员进行评估
│ ├课时96.使用Kmeans进行图像压缩
│ └课时97.K近邻算法原理
├<13-pca降维与svd矩阵分解>
│ │ ├课时100.PCA实例
│ ├课时101.SVD奇异值分解原理
│ ├课时98.K近邻算法代码实现
│ └课时99.PCA基本原理
├<14-scikit-learn模型建立与评估>
│ │ ├课时102.SVD推荐系统应用实例
│ ├课时103.使用python库分析汽车油耗效率.flv
│ │ ├课时104.使用scikit-learn库建立回归模型
│ ├课时105.使用逻辑回归改进模型效果
│ ├课时106..模型效果衡量标准
│ ├课时107.ROC指标与测试集的价值
│ └课时108.交叉验证
├<15-python库分析科比生涯数据>
│ │ ├课时109.多类别问题
│ ├课时110.Kobe.Bryan生涯数据读取与简介.flv
│ │ ├课时111.特征数据可视化展示
│ └课时112.数据预处理
├<16-机器学习项目实战-泰坦尼克获救预测>
│ │ ├课时113.使用Scikit-learn建立模型
│ ├课时114.船员数据分析.flv
│ │ ├课时115.数据预处理
│ ├课时116.使用回归算法进行预测
│ └课时117.使用随机森林改进模型
├<17-机器学习项目实战-交易数据异常检测>
│ │ ├课时118.随机森林特征重要性分析
│ ├课时119.案例背景和目标
│ ├课时120.样本不均衡解决方案
│ ├课时121.下采样策略
│ ├课时122.交叉验证
│ ├课时123.模型评估方法
│ ├课时124.正则化惩罚
│ ├课时125.逻辑回归模型
│ ├课时126.混淆矩阵
│ └课时127.逻辑回归阈值对结果的影响
├<18-python文本数据分析:新闻分类任务>
│ │ ├课时128.SMOTE样本生成策略
│ ├课时129.文本分析与关键词提取
│ ├课时130.相似度计算
│ ├课时131.新闻数据与任务简介
│ ├课时132.TF-IDF关键词提取
│ └课时133.LDA建模
├<19-python时间序列分析>
│ │ ├课时134.基于贝叶斯算法进行新闻分类
│ ├课时135.章节简介.flv
│ │ ├课时136.Pandas生成时间序列
│ ├课时137.Pandas数据重采样
│ ├课时138.Pandas滑动窗口
│ ├课时139.数据平稳性与差分法
│ ├课时140.ARIMA模型
│ ├课时141.相关函数评估方法
│ ├课时142.建立ARIMA模型
│ ├课时143.参数选择
│ ├课时144.股票预测案例
│ └课时145.使用tsfresh库进行分类任务
├<20-使用gensim库构造中文维基百度数据词向量模型>
│ │ ├课时146.维基百科词条EDA
│ ├课时147.使用Gensim库构造词向量
│ ├课时148.维基百科中文数据处理
│ └课时149.Gensim构造word2vec模型
├<21-机器学习项目实战-贷款申请最大化利润>
│ │ ├课时150.测试模型相似度结果
│ ├课时151.数据清洗过滤无用特征
│ ├课时152.数据预处理
│ └课时153.获得最大利润的条件与做法
├<22-机器学习项目实战-用户流失预警>
│ │ ├课时154.预测结果并解决样本不均衡问题
│ ├课时155.数据背景介绍
│ ├课时156.数据预处理
│ ├课时157.尝试多种分类器效果
│ └课时158.结果衡量指标的意义
├<23-探索性数据分析-足球赛事数据集>
│ │ ├课时159.应用阈值得出结果
│ ├课时160.内容简介
│ ├课时161.数据背景介绍.flv
│ │ ├课时162.数据读取与预处理
│ ├课时163.数据切分模块
│ ├课时164.缺失值可视化分析
│ ├课时165.特征可视化展示
│ ├课时166.多特征之间关系分析
│ └课时167.报表可视化分析
├<24-探索性数据分析-农粮组织数据集>
│ │ ├课时168.红牌和肤色的关系
│ ├课时169.数据背景简介
│ ├课时170.数据切片分析
│ ├课时171.单变量分析
│ ├课时172.峰度与偏度
│ ├课时173.数据对数变换
│ └课时174.数据分析维度
├<25-机器学习项目实战-http日志聚类分析>
│ │ ├课时175.变量关系可视化展示
│ ├课时176.建立特征工程
│ ├课时177.特征数据预处理
│ └课时178.应用聚类算法得出异常IP点
评论0