创建实例(Create Instance)

从样本数据集中交互创建实例。

输入

  • 数据:输入数据集
  • 参考数据:参考数据集

输出

  • 数据:创建的实例附加到输入数据集

功能

创建实例(Create Instance) 小部件基于输入数据创建一个新实例。 小部件在两列的表中显示输入数据集的所有变量。 变量 列表示变量的名称,而 列则用于设置变量的值。 每个值最初都设置为变量的中位数。通过单击相应的按钮,可以将值手动设置为 中位数平均值随机值 或 点击 手动 手动输入。 为了更轻松地搜索变量,该表附带了过滤器。 单击上述按钮之一时,仅考虑过滤后的变量。也可以通过右键单击一行并在上下文菜单中选择一个选项来设置值。

界面

  1. 按变量名过滤数据表。
  2. 该列代表变量的名称和类型。可以通过单击表头对表进行排序。
  3. 提供用于编辑值的控件。
  4. 将过滤后的变量的值设置为:
    • 中位数:输入数据集中变量的中位数
    • 平均值:输入数据集中变量的平均值
    • 随机数:输入数据集中变量范围内的随机值
    • 手动:手动输入值
  5. 如果勾选了 “此实例附加到输入数据”,则将创建的实例附加到输入数据集。 否则,单个实例将出现在输出中。 为了区分创建的数据和原始数据,添加了 源ID 变量。
  6. 如果选中 “自动应用”,则更改将自动提交。 否则,您必须在每次更改后按 “应用”
  7. 生成报告。
  8. 有关输入和参考数据集的信息。
  9. 有关输出数据集的信息。

示例

创建实例(Create Instance) 通常用于检查模型对于某些任意数据的性能。下面的工作流显示了基本用法,其中 Housing 数据集用于拟合线性回归(Linear Regression)模型,接着预测(predict)使用由 创建实例(Create Instance) 小部件创建的数据的目标值。 在 文件(File)创建实例(Create Instance) 之间插入排名(Rank)小部件可输出最重要的特征,并根据这些特征预测。

插入 选择列(Select Column) 小部件以忽略实际目标值。

下一个示例显示如何检查创建的实例是否是某种异常值。创建实例被发送到PCA散点图(Scatter Plot)显示,如果它与原始数据(蓝色)相距甚远,则可以将其视为异常值。

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里