线性投影(Linear Projection)

具有探索性数据分析的线性投影方法。

输入

  • 数据:输入数据集
  • 数据子集:实例的子集

输出

  • 选定数据:从图中选择的实例
  • 数据:带有附加列的数据,显示是否选择了一个
  • 分量:投影向量

功能

该小部件显示已标记类别的数据的线性投影 。 它支持各种类型的投影,例如圆形,线性判别分析主要成分分析,以及自定义投影。

考虑下面所示的 Iris 数据集的投影。 请注意,sepal widthsepal length 已经把 Iris setosa 与其他两个类别分开,而 petal lengthIris versicolorIris virginica 的最佳区分属性。

界面

  1. 显示的投影轴和其他可用轴。
  2. 通过使用 “建议特征” 优化投影。 此功能通过平均分类准确性为属性评分,并通过可视化同步更新返回得分最高的属性。
  3. 选择投影类型。
  4. 圆内的轴被隐藏。 圆半径可以使用滑块更改。

  5. 调整图属性:
    • 设置抖动 以防止点重叠(特别是对于离散属性)。
    • 显示图例在右侧显示图例。 单击并拖动图例将其移动。
    • 显示颜色区域 按类别为图表着色(请参见下面的屏幕截图)。
  6. 选择,缩放,平移和缩放 是浏览图形的选项
  7. 如果勾选了 “自动发送”,则会自动传达更改。 或者,按 发送
  8. 保存图像 将创建的图像以.svg或.png格式保存到您的计算机。
  9. 生成报告。

示例

线性投影(Linear Projection) 小部件的工作方式与其他可视化小部件一样。 在下面,我们将其连接到文件(File)小部件,以查看在二维平面上投影的集合。 然后,我们选择数据进行进一步分析,并将其连接到数据表(Data Table) 小部件,以查看所选子集的详细信息。

参考文献

Koren Y., Carmel L. (2003). Visualization of labeled data using linear transformations. In Proceedings of IEEE Information Visualization 2003, (InfoVis’03). Available here.

Boulesteix A.-L., Strimmer K. (2006). Partial least squares: a versatile tool for the analysis of high-dimensional genomic data. Briefings in Bioinformatics, 8(1), 32-44. Abstract here.

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里