选择列(Select Columns)

手动选择数据属性并组成数据域。

输入

  • 数据: 输入数据集

输出

  • 数据: 此小部件里所选择的列构成的数据集

功能

选择列(Select Columns) 小部件用于手动组合数据域。用户可以决定使用哪些属性以及如何使用。橙现智能会区分普通属性,分类属性(可选)和元属性。例如,我们需要构建一个分类模型,数据特征域将由一组普通属性和一个离散的分类属性组成。

注意:元属性不用于建模,但是可以通过其他部件将它们用作实例标签。

界面

在橙现智能中属性都会有一个类型,它可以是分类数据、数值数据的或文本数据。属性类型用出现在属性名称前面的符号标记(分别为C、N、S)。

  1. 被放置在左边的属性将不会被输出。
  2. 将会出现在新数据中的数据属性。
  3. 目标变量。如果没有的话,那么在新的数据集将会没有目标变量
  4. 新数据文件的元属性。这些属性包含在数据集中,但是对于目前的大多数方法与分析中并不会考虑这些属性。
  5. 将数据还原至输入文件输入时的默认样式。
  6. 将改变后的数据自动发送至输出小部件,如没有勾选可手动按“发送选中”将数据输出。

示例

在下面的示例中,文件(File)小部件中的 Iris (橙现智能中已提供)数据将输入到 选择列(Select Columns) 小部件中,我们仅选择输出两个属性(即花瓣宽度(petal width)和花瓣长度(petal length)。接着在数据表(Data Table)小部件中使用选择列(Select Columns) 小部件查看原始数据集与更改后的数据集。

为了更细致的讲解小部件,我们创建了一个工作流来定义 heart-disease (橙现智能中已提供)数据集中的分类问题。这份数据最初的目的是预测病人的冠状动脉直径是否会变窄。现在,我们根据年龄age、胸痛chest pain和胆固醇水平cholesterol将问题更改为按照性别gender分类,并把冠状动脉直径缩小作为一个元属性,来判断心脏病患者的冠状动脉直径缩小是否与性别相关。

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里