DBSCAN
使用 DBSCAN 聚类算法对项目进行分组。
输入
- 数据:输入数据集
输出
- 数据:以聚类索引为类属性的数据集
功能
小部件应用 DBSCAN聚类算法对数据进行运算,并输出具有聚类索引作为元属性的新数据集。小部件还显示了排序的图形,其中包含到第 k 个最近邻居的距离。根据此方法中的建议,将 k 值设置为“核心点邻居”。这为用户提供了理想的 邻近距离 设置选择的想法。正如作者建议的那样,应将此参数设置为图形中第一个“山谷”中的第一个值。
界面
- 设置集群的“核心邻居的最小数量”和最大邻域距离。
- 设置用于分组项目的距离度量。
- 如果勾选了“自动应用”,则小部件将自动提交更改。 或者,单击应用。
- 该图显示了到第k个最近邻居的距离。 k 由“核心点邻居”选项设置。 左右移动黑色滑块,您可以选择合适的 邻居距离。
示例
我们将具有选定的 Iris 数据集的文件(File)小部件连接到 DBSCAN 小部件。 在 DBSCAN 小部件中,我们将“核心点邻居”参数设置为5,然后将“邻居距离”选择为图形中第一个“谷”中的值。 我们在散点图小部件中显示聚类。
反馈问题
文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈
点我反馈进入反馈页面不知道如何反馈, 请点击这里