机器学习是关于统计模型的。
你可能知道参数模型,比如当你计算月球的质量时,你有一个公式。如果你知道这些变量,你可以通过插入它们并进行数学运算来计算答案。
有时你没有一个公式,但你有大量的数据,你想找到模式或作出预测。在这种情况下,您应该使用非参数的机器学习模型。
我是洛伦·舒尔,是一名在MathWorks工作了30多年的科学家。我将带您了解三种类型的机器学习:聚类、分类和回归。
首先,我们将讨论集群。
假设我给你一堆卡片,上面有图片,我让你把这些卡片分成几组。不同的人以不同的方式将这些卡片分组。
这些卡片上是什么导致了这种情况的发生?嗯,它们是狗、猫和鸟的照片。
你们中的一些人说:“啊哈!我在这里看到了三个不同的群体:很明显,狗、猫和鸟。”
你们中的一些人看到四条腿的动物和两条腿的动物,然后把卡片分成两堆。
你们中那些把它们放在一堆的人可能会说,“它们都是动物!”
好吧,谁说得对?你们都是,因为说明书上说要把卡片分组。
这就是集群:集群可以帮助您将一组事物划分为具有不同属性的组。
现在,让我们继续进行分类。
你有相同的卡片,每一张都标有三个类别:狗、猫或鸟。
你需要确定有助于区分不同动物的特征。
您可以使用这些功能训练一个模型,该模型将确定某个对象是否被标记为狗、猫或鸟。
现在我给你一个新的形象。它属于什么类别?好吧,让我们把它通过模型来计算出来。
这个模型只擅长对狗、猫和鸟进行分类,但它显然不是为其他任何东西开发的。它在马身上尽了最大努力。
这是分类,您可以将其用于图像中的对象检测、预测性维护和垃圾邮件检测。
第三种类型的机器学习是回归,在回归中,我们不是将输出分类为有限的数量,而是试图在一个连续统上找到答案,比如动物的最大奔跑速度。
为了建立一个预测速度的模型,我们做了以前做过的事情——选择可能相关的功能。例如,让我们试试动物的重量和腿的长度。
该模型使用这些特征来估计动物在该速度连续体上的降落位置。
这就是回归。回归模型被用于许多应用中,比如预测用电量或股票价格。
这就是三种不同的机器学习。
机器学习是一个极其复杂的话题,我在这里只是略读了一下。您可能听说过深度学习,这是一种机器学习,您不需要手动选择功能。相反,这些特性是作为模型训练过程的一部分来学习的,但它需要花费大量数据。
要获得更多实用信息和灵感,请从以下链接开始。