热图(Heat Map)
绘制一对属性的热图。
输入
- 数据:输入数据集
输出
- 选定数据:从图中选择的实例
功能
热图 用于按类别在双向矩阵中可视化属性值。它仅适用于包含连续变量的数据集。 这些值用颜色表示:某个值越高,表示的颜色越深。通过在 x 和 y 轴上组合类和属性,我们可以看到属性值最强的地方和最弱的地方,从而使我们能够找到每个类的典型特征(离散)或值范围(连续)。
界面
- 配色图例。
低
和高
是调色板的阈值(低值属性的阈值低,高值属性的阈值高)。选择一个调色板,该调色板具有两种极端的颜色,并在中间具有中性(黑色或白色)颜色,这样就可以设置一个有意义的中点值(默认值为0)。 - 合并数据。
示例
下面的 热图(Heat Map) 显示 Housing 数据集的属性值。上述数据集涉及波士顿郊区的房屋价值。
我们在地图上看到的第一件事是 B 和 Tax 属性,这是仅有的两个深橙色颜色。B 属性提供有关按城镇划分的 blacks 比例的信息,Tax 属性通知我们每10,000美元的全值财产税率。 为了获得更清晰的热图,我们然后使用选择列(Select Columns)小部件并从数据集中删除这两个属性。 然后,我们再次将数据输入到 热图(Heat Map) 中。 新的预测提供了更多信息。
通过删除 B 和 Tax,我们可以看到其他决定因素,即 Age 和 ZN。 Age 属性提供有关 1940 年前建造的自有住房的比例的信息,ZN 属性可告知我们每个城镇非零售业务用地的比例。
热图(Heat Map) 小部件是发现数据中相关特征的好工具。 通过删除一些更明显的功能,我们发现了隐藏在后面的新信息。
参考文献
反馈问题
文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈
点我反馈进入反馈页面不知道如何反馈, 请点击这里