文件(File)

从输入文件读取属性值数据

输出

  • 数据:来自文件的数据集

功能

文件(File)小部件读取输入数据文件,并将数据集发送到其输出通道。小部件中会记录最近打开的文件的历史,还可以载入预装的示例数据集。

文件读取格式:

  • Excel (.xlsx)
  • tab 分隔符的文件 (.txt)
  • 逗号分隔符文件 (.csv)
  • 网址
  • 对于其他可读取格式:下面其他格式部分

界面

  1. 浏览以前打开的数据文件,或加载示例数据。
  2. 浏览数据文件。
  3. 重新加载当前选择的数据文件。
  4. 插入URL地址中的数据,包括Google表格中的数据。
  5. 有关已加载数据集信息:数据集大小,数据特征的数量与类型。
  6. 有关数据集中的其他信息。可以通过双击功能来对其进行编辑。 用户可以更改属性名称,选择每个属性的变量类型,以及选择如何进一步定义属性。 用户还可以决定忽略属性。
  7. 浏览文档数据集。
  8. 查看帮助文档
  9. 生成报告
  10. 输出数据详情

示例

大多数橙现智能工作流程都以 文件(File) 小部件开始。 在下面的示例中,该小部件用于读取发送到 数据表(Data Table)箱线图(Box Plot) 小部件的数据。

加载你的数据

  • 橙现智能可以导入任何用逗号或制表符分隔的数据文件,Excel文件或网址。使用此小部件来加载数据,并在需要时定义类和元属性。
  • 为了指定数据属性,列标题中的名称可以写作 “类型#标签名” 形式。c 代表类别, m 代表元属性,i 代表忽略列,C,D,S 分别代表连续,离散和字符串属性类型。例如:C#mph,mS#name,i#dummy。
  • 橙现智能的原始格式是制表符分隔的数据文件,该文件含三行标题。 第一行包含属性名称,第二行包含属性类型(continuous(连续),discrete(离散)或string(字符串)),第三行可选(class,meta或time)。

阅读有关加载数据的更多信息,点击这里

其他格式

支持的格式和加载它们的小部件:

  • 距离矩阵:距离文件
  • 预测模型:加载模型
  • 网络:网络插件中的网络文件
  • 图像:从图像分析插件导入图像
  • 语料:来自自然语言处理插件的语料数据
  • 细胞数据:来自细胞插件
  • 光谱文件:来自光谱插件

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里