创建实例(Create Instance)
从样本数据集中交互创建实例。
输入
- 数据:输入数据集
- 参考数据:参考数据集
输出
- 数据:创建的实例附加到输入数据集
功能
创建实例(Create Instance) 小部件基于输入数据创建一个新实例。 小部件在两列的表中显示输入数据集的所有变量。 变量
列表示变量的名称,而 值
列则用于设置变量的值。 每个值最初都设置为变量的中位数。通过单击相应的按钮,可以将值手动设置为 中位数
, 平均值
, 随机值
或 点击 手动
手动输入。 为了更轻松地搜索变量,该表附带了过滤器。 单击上述按钮之一时,仅考虑过滤后的变量。也可以通过右键单击一行并在上下文菜单中选择一个选项来设置值。
界面
- 按变量名过滤数据表。
- 该列代表变量的名称和类型。可以通过单击表头对表进行排序。
- 提供用于编辑值的控件。
- 将过滤后的变量的值设置为:
中位数
:输入数据集中变量的中位数平均值
:输入数据集中变量的平均值随机数
:输入数据集中变量范围内的随机值手动
:手动输入值
- 如果勾选了 “此实例附加到输入数据”,则将创建的实例附加到输入数据集。 否则,单个实例将出现在输出中。 为了区分创建的数据和原始数据,添加了
源ID
变量。 - 如果选中 “自动应用”,则更改将自动提交。 否则,您必须在每次更改后按 “应用”。
- 生成报告。
- 有关输入和参考数据集的信息。
- 有关输出数据集的信息。
示例
创建实例(Create Instance) 通常用于检查模型对于某些任意数据的性能。下面的工作流显示了基本用法,其中 Housing 数据集用于拟合线性回归(Linear Regression)模型,接着预测(predict)使用由 创建实例(Create Instance) 小部件创建的数据的目标值。 在 文件(File) 与 创建实例(Create Instance) 之间插入排名(Rank)小部件可输出最重要的特征,并根据这些特征预测。
插入 选择列(Select Column) 小部件以忽略实际目标值。
下一个示例显示如何检查创建的实例是否是某种异常值。创建实例被发送到PCA,散点图(Scatter Plot)显示,如果它与原始数据(蓝色)相距甚远,则可以将其视为异常值。
反馈问题
文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈
点我反馈进入反馈页面不知道如何反馈, 请点击这里