热图(Heat Map)

绘制一对属性的热图。

输入

  • 数据:输入数据集

输出

  • 选定数据:从图中选择的实例

功能

热图 用于按类别在双向矩阵中可视化属性值。它仅适用于包含连续变量的数据集。 这些值用颜色表示:某个值越高,表示的颜色越深。通过在 x 和 y 轴上组合类和属性,我们可以看到属性值最强的地方和最弱的地方,从而使我们能够找到每个类的典型特征(离散)或值范围(连续)。

界面

  1. 配色图例。 是调色板的阈值(低值属性的阈值低,高值属性的阈值高)。选择一个调色板,该调色板具有两种极端的颜色,并在中间具有中性(黑色或白色)颜色,这样就可以设置一个有意义的中点值(默认值为0)。
  2. 合并数据。

示例

下面的 热图(Heat Map) 显示 Housing 数据集的属性值。上述数据集涉及波士顿郊区的房屋价值。

我们在地图上看到的第一件事是 BTax 属性,这是仅有的两个深橙色颜色。B 属性提供有关按城镇划分的 blacks 比例的信息,Tax 属性通知我们每10,000美元的全值财产税率。 为了获得更清晰的热图,我们然后使用选择列(Select Columns)小部件并从数据集中删除这两个属性。 然后,我们再次将数据输入到 热图(Heat Map) 中。 新的预测提供了更多信息。

通过删除 BTax,我们可以看到其他决定因素,即 AgeZNAge 属性提供有关 1940 年前建造的自有住房的比例的信息,ZN 属性可告知我们每个城镇非零售业务用地的比例。

热图(Heat Map) 小部件是发现数据中相关特征的好工具。 通过删除一些更明显的功能,我们发现了隐藏在后面的新信息。

参考文献

Housing Dataset

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里

更新时间: