吴恩达机器学习专项课程 | 监督学习-part-2

吴恩达机器学习专项课程讲述了监督学习算法致力于学习输入、输出或X到Y的映射关系。在上一视频中,您已了解到回归算法是监督学习的一种,它能够从无数可能的数字中预测出一个具体的数字。而监督学习的另一种主要类型是分类算法。

以乳腺癌检测为例,来深入了解分类问题。假设您正在构建一个机器学习系统,以帮助医生通过诊断工具来检测乳腺癌。这至关重要,因为早期发现可能会挽救患者的生命。基于患者的医疗记录,您的机器学习系统会尝试判断肿块是否为恶性,即是否存在癌变风险;或者肿块是否为良性,即是否只是非癌性的肿块,风险相对较低。

在某些情况下,您的数据集可能包含各种大小的肿瘤,这些肿瘤被标记为良性(本例中为0)或恶性(本例中为1)。您可以将这些数据绘制成图表,其中横轴代表肿瘤大小,纵轴则只有两个值0或1,分别代表肿瘤是良性还是恶性。

与回归算法不同,分类算法旨在预测的输出或类别数量是有限的。在这个例子中,只有两个可能的输出:0或1,分别对应良性和恶性。这与回归算法试图预测无限多可能数字的情况截然不同。

由于本例中只有两个可能的输出或类别,因此您可以将数据集绘制在一条线上,并使用不同的符号来表示类别,例如圆圈代表良性示例,十字代表恶性示例。如果新患者前来接受诊断,并已知其肿块大小,那么问题就变为:您的系统会将这种肿瘤分类为良性还是恶性?

实际上,在分类问题中,输出类别的数量可能超过两个。例如,您可能正在学习一种算法,能够区分多种类型的癌症诊断。在这种情况下,您将拥有三个或更多的可能输出类别。

值得注意的是,在分类中,术语“输出类”和“输出类别”常常可以互换使用。所以,当我说到输出类别时,其实就是在指类别。

总结来说,分类算法旨在预测类别。这些类别不必是数字,它们可以是任何非数字的标识,例如预测图片中的动物是猫还是狗,或者预测肿瘤是良性还是恶性。当然,类别也可以是数字,如0、1或0、1、2等,但关键在于,分类预测的是有限数量的可能输出类别,而不是这些类别之间的所有可能数字。

在我们之前研究的监督学习示例中,我们只有一个输入值,即肿瘤大小。但实际上,您也可以使用多个输入值来预测输出。例如,如果您还知道每位患者的年龄,那么您的新数据集将包含两个输入:年龄和肿瘤大小。在这个扩展的数据集中,您可以使用不同的符号来表示良性和恶性的患者。

当新患者前来就诊时,医生可以测量其肿瘤大小和记录其年龄。此时,学习算法可能会找到一条边界线,将恶性肿瘤与良性肿瘤分开。算法的任务就是确定如何通过这些数据来拟合这条边界线,以便帮助医生进行准确的诊断。

从这个例子中,我们可以看到如何输入患者的年龄和肿瘤大小来进行预测。在其他机器学习问题中,可能还需要更多的输入值。比如,在乳腺癌检测中,还可能考虑肿瘤块的厚度、细胞大小的均匀性、细胞形状的均匀性等因素。

回顾一下,监督学习是将输入X映射到输出Y的过程,其中学习算法从带有正确答案的示例中学习。监督学习主要有两种类型:回归和分类。在回归应用中,如预测房屋价格,学习算法需要从无数可能的输出数字中预测出一个数字。而在分类中,学习算法则需要预测一个类别,这个类别是从一组有限的输出中选择出来的。

现在您已经了解了什么是监督学习,包括回归和分类。接下来,我们将探讨第二种主要的机器学习类型——无监督学习。

本文资料来源于互联网,仅做网络分享,如有侵权,请联系删除;不代表Sora中文网立场,如若转载,请注明出处:https://www.allinsora.com/5592

(0)
上一篇 2024年3月14日 上午9:39
下一篇 2024年3月14日 上午9:58

相关推荐

  • 吴恩达机器学习专项课程 | 理解梯度下降

    现在让我们更深入地研究梯度下降,以更好地了解它在做什么以及它为什么有意义。这是您在吴恩达机器学习专项课程中看到的梯度下降算法。提醒一下,这个变量,这个希腊符号 Alpha,是学习率。学习率控制更新模型参数 w 和 b 时采取的步骤大小。简单地说,学习率决定了每次参数更新的幅度。 这里的这个术语,这个 d over dw,这是一个导数。按照数学惯例,这个 d …

    2024年3月14日
    0097
  • 吴恩达机器学习专项课程 | 特征缩放-part-1

    在吴恩达机器学习专项课程中,我们将探讨一种名为特征缩放的技术,该技术能够优化梯度下降的运行效率,特别是在处理具有不同取值范围的特征时。特征缩放通过对训练数据进行转换,使得不同特征的值范围变得可比较,从而提高梯度下降算法的性能。 特征取值范围对梯度下降的影响:当特征的取值范围差异很大时,梯度下降可能会运行缓慢。这是因为某些特征的微小变化可能会对预测结果产生显著…

    2024年4月12日
    0074
  • 斯坦福CS229 | 局部加权和逻辑回归

    斯坦福CS229介绍了局部加权和逻辑回归算法。它解释了如何使用局部加权回归来适应非线性函数,并介绍了逻辑回归的概念和用途。视频中还提到了牛顿法作为一种优化算法,可以用来最大化似然函数。牛顿法收敛速度快,但在参数较多时计算成本较高。 局部加权和逻辑回归:斯坦福CS229中讲到了局部加权回归,它是一种修改线性回归的方法,使其适应非线性函数。视频还提到了特征选择算…

    2024年3月14日
    00105
  • 斯坦福CS229 | 调试 ML 模型和错误分析

    斯坦福CS229介绍了如何通过错误分析和调试机器学习模型来提高性能。讨论了如何通过调试算法和优化目标函数来改进模型性能,以及如何使用诊断方法来识别问题并优化系统。视频还强调了对于复杂的机器学习管道,逐步移除特征并观察性能变化的重要性。最后,强调了对于实际项目的重要性,以及如何通过错误分析和优化来提高系统准确性。 调试机器学习算法:斯坦福CS229主要讨论了如…

    2024年4月8日
    00233
  • 吴恩达机器学习专项课程 | 线性回归模型-part-1

    在吴恩达机器学习专项课程中,我们深入探讨了监督学习的整个过程,并以线性回归模型作为第一个实例进行了详细解释。线性回归模型是通过为数据拟合一条直线来预测数值输出的方法,这在现实世界的许多问题中都有着广泛的应用。 我们使用了房屋大小和价格的数据集作为示例,展示了如何利用线性回归模型根据房屋大小来预测其价格。通过训练模型,我们得到了一条与数据点拟合的直线,这条直线…

    2024年3月14日
    0092

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

关注微信
Sora改变AI认知方式,开启走向「世界模拟器」的史诗级的漫漫征途。