轮廓图(Silhouette Plot)
数据集群内一致性的图形表示。
输入
- 数据:输入数据集
输出
- 选定数据:从图中选择的实例
- 数据:整个数据,添加了表示是否选择了一个实例的列
功能
轮廓图(Silhouette Plot) 小部件提供了数据聚类内一致性的图形表示,并为用户提供了直观评估聚类质量的方法。轮廓分数 是衡量对象与其自身的聚类相比于其他聚类的相似程度的度量,并且在创建轮廓图时至关重要。轮廓得分接近 1 表示数据实例接近聚类的中心,而轮廓得分接近 0 的实例位于两个聚类之间的边界上。
界面
- 选择距离度量。 您可以选择: -欧几里得 (两点之间的“直线”距离) -曼哈顿 (所有属性的绝对差之和) -余弦 (1-两个向量之间的夹角余弦)
- 选择聚类标签。 您可以决定是否按聚类对实例进行分组。
- 显示选项:
- 保存图像 将创建的轮廓图以 .png 或 .svg 格式保存到您的计算机。
- 生成报告。
- 创建的轮廓图。
示例
我们决定对 iris 数据集使用轮廓图(Silhouette Plot)。 我们选择了轮廓分数较低的数据实例,并将其作为子集传递给散点图(Scatter Plot)小部件。由于您可以清楚地看到子集位于两个聚类之间的边界中,因此此可视化仅确认 轮廓图(Silhouette Plot) 小部件的准确性。
了解更多, 请参考.
反馈问题
文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈
点我反馈进入反馈页面不知道如何反馈, 请点击这里