机器学习数据不均衡处理教程

学习对数据进行过采样和欠采样、应用 SMOTE、集成方法和成本敏感型学习假设

课程英文名:Machine Learning with Imbalanced Data

此视频教程共13.5小时,中英双语字幕,画质清晰无水印,源码附件全

下载地址

课程编号:335
百度网盘地址:https://pan.baidu.com/s/1_eoVIwUijTDjw8v5pVDccA?pwd=ndku
夸克网盘(不限速)地址:https://pan.quark.cn/s/ac8226352700

课程内容

你将会学到的

  • 应用随机欠采样从多数类中删除观察结果
  • 通过删除难以分类的观察来执行欠采样
  • 通过在类分离的边界保留观察值来进行欠采样
  • 应用随机过采样来增加少数类
  • 创建综合数据以增加少数类的示例
  • 实施 SMOTE 及其变体以综合生成数据
  • 使用集成方法和采样技术来提高模型性能
  • 更改模型优化的错误分类成本以适应少数类
  • 使用最适合不平衡数据集的指标确定模型性能

本课程包括:

  • 11 小时 长的随选视频
  • 20 篇文章
  • 2 个可下载资源
  • 在移动设备和电视上观看
  • 结业证书

要求

  • 了解机器学习基本算法,即回归、决策树和最近邻
  • Python 编程,包括熟悉 NumPy、Pandas 和 Scikit-learn
  • Python 和 Jupyter 笔记本安装

说明

欢迎使用不平衡数据集进行机器学习。在本课程中,您将学习多种可用于不平衡数据集的技术,以提高机器学习模型的性能。

如果您现在正在使用不平衡的数据集并希望提高模型的性能,或者您只是想了解更多有关如何解决数据不平衡的信息,本课程将向您展示如何解决。

我们将通过引人入胜的视频教程逐步指导您,并教您有关使用不平衡数据集的所有知识。在这门综合课程中,我们几乎涵盖了处理不平衡数据集的所有可用方法,讨论了它们的逻辑、它们在 Python 中的实现、它们的优点和缺点,以及使用该技术时的注意事项。具体来说,您将学习:

  • 随机抽样不足或侧重于突出某些样本群体的抽样方法
  • 随机过采样方法以及根据现有观察创建新示例的方法
  • 利用多个弱学习器的力量与采样技术相结合来提高模型性能的集成方法
  • 成本敏感的方法,对少数群体的错误决定进行更严厉的惩罚
  • 在不平衡数据集上评估模型性能的适当指标

在课程结束时,您将能够决定哪种技术适合您的数据集,和/或应用和比较不同方法在多个数据集上返回的性能改进。

这个全面的机器学习课程包括超过 10 小时视频的 50 多场讲座,所有主题都包括动手 Python 代码示例,您可以将其用作参考和练习,并在您自己的项目中重复使用。

此外,代码会定期更新,以跟上新趋势和新 Python 库的发布。

那你还在等什么?立即注册,了解如何处理不平衡数据集并构建更好的机器学习模型。

此课程面向哪些人:

  • 处理不平衡数据集的数据科学家和机器学习工程师
  • 希望提高在不平衡数据集上训练的模型性能的数据科学家
  • 想要学习机器学习中级内容的学生
  • 处理不平衡的多类目标的学生