Coursera Machine Learning 学习笔记(二)

- Supervised Learning

       对于监督学习我们先看一个例子,下图中表示的是一个房价预测的例子。图中横坐标表示房屋占地面积,纵坐标表示房屋交易价格。图中的每个叉则表示一个房屋实例。

       技术分享

       现在,我们希望能够预测一个房屋占地面积为750平方英尺的房屋的交易价格是多少。简单的方法是根据这些数据点的分布,画出一条合适的直线,然后根据这条直线来预测。当然,在此房价预测例子中,一个二次函数更加适合已有数据的分布。因此,我们可能会更加希望使用这个二次函数的曲线来进行房价预测。

       技术分享

       因此,我们称上述这样的学习叫做监督学习,因为我们预先给了算法正确的结果,即所有我们所观察到的变量。

       上述的问题又称为回归问题,我们所预测的值为连续值。

       下面,我们再看一个监督学习的例子:

       假设我们想要根据病人肿瘤的尺寸来预测病人的肿瘤是否为恶性:

       技术分享

       当然,有时候我们所用到的变量不止一个,如病人的年龄、肿瘤的大小以及形状等等。

       技术分享

       图中,圆圈代表良性而叉代表恶性,我们要学习的问题就变成了划分良性肿瘤和恶性肿瘤。

       这样的问题又叫做分类问题,所分类用到的是离散值。我们希望通过这样的算法来将数据分类到不同的种类。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。