DBSCAN

使用 DBSCAN 聚类算法对项目进行分组。

输入

  • 数据:输入数据集

    输出

  • 数据:以聚类索引为类属性的数据集

功能

小部件应用 DBSCAN聚类算法对数据进行运算,并输出具有聚类索引作为元属性的新数据集。小部件还显示了排序的图形,其中包含到第 k 个最近邻居的距离。根据此方法中的建议,将 k 值设置为“核心点邻居”。这为用户提供了理想的 邻近距离 设置选择的想法。正如作者建议的那样,应将此参数设置为图形中第一个“山谷”中的第一个值。

界面

  1. 设置集群的“核心邻居的最小数量”和最大邻域距离。
  2. 设置用于分组项目的距离度量。
  3. 如果勾选了“自动应用”,则小部件将自动提交更改。 或者,单击应用
  4. 该图显示了到第k个最近邻居的距离。 k 由“核心点邻居”选项设置。 左右移动黑色滑块,您可以选择合适的 邻居距离

示例

我们将具有选定的 Iris 数据集的文件(File)小部件连接到 DBSCAN 小部件。 在 DBSCAN 小部件中,我们将“核心点邻居”参数设置为5,然后将“邻居距离”选择为图形中第一个“谷”中的值。 我们在散点图小部件中显示聚类。

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里

更新时间: