箱线图(Box Plot)

显示属性值的分布。

输入

  • 数据: 输入数据集

输出

  • 选定数据:从图中选择的实例
  • 数据:带有附加列的数据,显示是否选择了一个点

功能

箱线图(Box Plot) 小部件显示属性值的分布。使用此小部件检查任何新数据以快速发现异常是一种最佳实践,例如重复的值(例如,橙色和橘色),离群值等

界面

  1. 选择要绘制的变量。 选中 按相关性排序,以对所选子组按 Chi2ANOVA 排序变量。
  2. 选择 子组 以查看由离散子组显示的箱形图
  3. 将实例按子组分组时,可以更改显示模式。带注释的框将显示最终值,均值和中位数,而比较中位数和比较均值会在子组之间比较所选值。

continuous

4.平均值(深蓝色垂直线)。细蓝线代表标准差。 5.第一个(25%)和第三个(75%)分位数的值。 蓝色高亮显示的区域表示第一个和第三个四分位数之间的值。 6.中位数(黄色垂直线)。 7.如果勾选了 “自动发送”,则会自动传达更改。 或者,按 发送。 8.访问帮助,保存图像或生成报告。

对于离散属性,条形图代表具有每个特定属性值的实例数。 该图显示了 Zoo 数据集中不同动物类型的数量:共有41种哺乳动物,13种鱼类,20种鸟类,依此类推。

示例

箱线图(Box Plot) 小部件最常在文件(File)小部件之后使用,以观察数据集的统计属性。 在第一个示例中,我们使用 heart-disease 数据来检查变量。

箱线图(Box Plot) 对于查找特定数据集的属性也很有用,例如,在另一个小部件中手动定义的一组实例, 例如散点图(Scatter Plot), 聚类或树节点。现在让我们使用 zoo 数据并使用距离(Distances)层次聚类(Hierarchical Clustering)创建一个典型的聚类工作流。

现在定义聚类选择的阈值(单击顶部的标尺)。将 箱线图(Box Plot) 连接到层次聚类(Hierarchical Clustering),勾选 按相关性排序,然后选择 Cluster 作为子组。 这将根据属性定义所选子组(在我们的情况下是聚类)的程度来对属性进行排序。 似乎我们的聚类确实与动物类型非常吻合!

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里