创建类别(Create Class)

从字符串属性创类别属性

输入

  • 数据:输入数据

输出

  • 数据:添加了新类别的数据

功能

创建类别(Create Class) 从现有的离散或字符串属性创建新的类别属性。该小部件与所选属性的字符串值匹配,并为匹配的实例构造一个新的用户定义值。

界面

  1. 构造新类别的属性。
  2. 匹配:
    • 名称:新类别的名称
    • 子字符串:与上面定义的属性的值匹配的正则表达式定义的子字符串
    • 实例数目:与子字符串匹配的实例数
    • “+” 添加新的类别值
  3. 新类列的名称。
  4. 只在开头匹配 将从字符串开头开始匹配。区分大小写的字符也将根据大小写匹配。
  5. 生成报告。
  6. “应用” 提交结果。

    示例

这是使用 “auto-mpg” 数据集的简单示例。将数据传递给创建类别(Create Class)。 选择* car_name 作为创建新类的列。在这里,我们希望创造与汽车品牌匹配的新值。 首先,我们输入 ford 作为匹配字符串的新值。然后,我们定义与数据实例匹配的子字符串。这意味着所有在其 car_name 中包含 ford 的实例现在在新的类列中将具有值 ford。 接下来,我们为 hondafiat 定义相同的内容。该小部件将告诉我们还有多少个实例不匹配(剩余实例)。我们将它们命名为 other,但是您可以点击 ”+” 继续创建新值。

我们将新的类列命名为 car_brand,并在字符串的开头进行匹配。

最后,我们可以在数据表(Data Table)中观察新列,或在散点图(Scatter Plot)中将该值用作着色依据

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里