有多种方法可以讨论为什么混淆矩阵在机器学习(ML) 中很有价值,但最简单的方法之一是解释混淆矩阵是一种数据可视化资源。
混淆矩阵使查看者能够一目了然地看到使用分类器或其他算法的结果。通过使用简单的表格来显示分析结果,混淆矩阵本质上将您的输出归结为更易于理解的视图。
混淆矩阵使用特定的术语来排列结果。有真阳性和真阴性,也有假阳性和假阴性。对于更复杂的混淆矩阵或基于比较分类的混淆矩阵,这些值可能显示为两个不同对象的实际类别和预测类别。
无论语义术语如何,结果都会分组到正方形(或矩形)表中。
此视图使分析师可以更轻松地了解算法对结果进行分类的准确性。(阅读New Generators Put Modern Algorithms to Work on ASCII Art。)
混淆矩阵的实用性与机器学习项目的复杂性有关,也与信息格式化和交付给用户的方式有关。想象一串线性结果,包括假阳性、假阴性、真阳性和真阴性。(阅读机器学习 101。)
用户必须将所有这些线性结果制成图表,才能了解算法的工作原理及其准确性。通过混淆矩阵,这些信息可以简单地以强大的视觉模型呈现。
例如,假设机器被要求对 20 张图像进行分类,其中 5 个是水果,5 个是蔬菜。如果混淆矩阵包含以下内容(从左上角顺时针开始):7、5、3、5,则该矩阵显示 7 种被正确识别为蔬菜,而 3 种被正确分类为水果。
如图所示,另外 10 个是程序无法正确识别图像的结果。
混淆矩阵在各种机器学习分析中都很有用。通过观察此资源,用户可以弄清楚如何处理维度和过度拟合等问题,以及优化算法的其他方法。
上一篇我们送上的文章是
机器学习专业人士如何使用结构化预测? , _!在下一篇继续做详细介绍,如需了解更多,请持续关注。
本文由
日本NEC锂电池中国营销中心于2023-07-16 17:41:01 整理发布。
转载请注明出处.