监督学习和无监督学习之间的区别在于,这些过程中只有监督学习之一利用了标记数据。另一种是无监督学习,则不然。
使用标记数据可以帮助相关数据科学或机器学习程序获得一个简单的参考点,用于评估测试和训练数据,然后将这些见解应用于其他外部数据集的分析。
说明这一点的最好方法之一是用水果篮的例子。
假设数据科学程序必须解决一个分类问题,该问题涉及将图像或对象分类为不同类型的水果类别(香蕉、苹果和葡萄)。
有了标签数据,系统已经有了预先批准的香蕉、苹果和葡萄的示例,因此分类和排序工作是根据那些人类操作员从程序诞生之初就输入的具体示例进行的。
无监督学习的工作原理有点不同,通常涉及机器更陡峭的学习曲线。
如果没有标记数据,程序将需要使用属性来确定分类结果 - 例如,分析每条数据的颜色、形状和结构,以将其分类或排序到给定类别。
在其他类型的数据科学程序中,标记数据的使用发生在空间上下文中 - 例如,空间背景上的白球和黑球显示了数据科学程序如何在监督学习程序中对标记数据进行排序。
监督学习系统和无监督学习系统的另一个非常有趣的区别在于它们的应用程序。
如前所述,监督学习系统往往更容易访问,并且可以应用于更多样化的零售或制造项目或其他情况,在这些情况下,企业 IT 可以方便地使用标记数据来确定数据科学项目的方向。
无监督机器学习的应用通常更复杂,但对于研究实验室或其他利益相关者来说可能更有用。
随着机器学习在过去几年的进步,工程师们找到了一种方法来协同监督学习和无监督学习的优势。
一些成果包括半监督分类和半监督聚类的实践。在这些和其他类型的半监督学习中,一些数据点被标记,而另一些则没有。通常,会有较小的标记数据集,并且机器学习程序将能够根据需要推断以处理其余未标记数据。今天的专家表明,一些公司正在采用这些类型的方法,不仅是为了提高效率,也是为了降低成本,因为供应商提高了标签或注释数据的价格。
上一篇我们送上的文章是
点对点内容交付对企业有什么影响? , _!在下一篇继续做详细介绍,如需了解更多,请持续关注。
本文由
日本NEC锂电池中国营销中心于2023-07-16 17:28:19 整理发布。
转载请注明出处.