提升曲线(Lift Curve)

针对随机分类器衡量所选分类器的性能。

输入

  • 评估结果:测试分类算法的结果

功能

提升曲线(Lift Curve) 显示用于分析真阳性数据实例相对于分类器阈值或我们分类为阳性的实例数量的比例的曲线。

累积增益图显示了真阳性实例(例如接受报价的客户数量)与阳性实例数量(联系的客户数量)的函数,假设实例是根据模型的顺序进行排序的阳性的可能性(例如客户排名)。

界面

提升曲线显示了选择中真阳性实例的比例与联系的客户比例之间的比率。 请参阅教程以获取更多详细信息.

  1. 选择所需的目标类别。 默认是按字母顺序选择的。
  2. 选择观察提升曲线还是累积增益。
  3. 如果测试结果包含多个分类器,则用户可以选择要查看的曲线。单击分类器以选择或取消选择曲线。
  4. 显示提升凸包 在所有分类器的升力曲线上绘制凸包(黄色曲线)。曲线显示了针对每个期望升程或累积增益的最优分类器(或其组合)。
  5. “保存图像” 以 .svg 或 .png 格式保存创建的图像。
  6. 生成报告。
  7. 带有“提升”或“累积增益”与“阳性率”的图。 虚线表示随机分类器的行为。

示例

提供 提升曲线(Lift Curve) (评估数据)所需信号的正确类型的小部件是测试与评分(Test & Score)预测(Predictions)

在下面的示例中,我们观察了银行营销数据的提升曲线和累积收益,其中的分类目标是根据客户的年龄,工作,受教育程度,婚姻状况和类似数据来预测客户是否接受定期存款。 该数据集在“数据集”小部件中可用。 我们在“测试和评分”小部件中运行学习算法,并将结果发送到“提升曲线”以查看其在随机模型下的性能。 在测试的两种算法中,逻辑回归的性能优于朴素的贝叶斯分类器。 曲线告诉我们,通过选择模型所排名的前20%的客户,与选择具有20%的客户的随机样本相比,我们命中的积极实例要多四倍。

反馈问题

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

点我反馈

进入反馈页面不知道如何反馈, 请点击这里