模型优化与解释

经过上一部分的特征工程, 我们已经有了一个相对较好的模型, 下一步我们还可以进一步优化模型, 然后根据模型参数解释模型

介绍

这部分我们首先使用排名小部件进行特征选择, 然后使用数据表查看模型参数从而解释模型.

为了防止过拟合, 我们可以在线性回归小部件进行模型的正则化设置, 比如选择 锁套回归, 然后设置 正则化强度. 经过正则化后, 可以发现模型结果没有什么变化.

如果数据量够大, 一般也不用特征选择. 不过为了模型解释的方便, 我们这里进行一下特征选择.

我们根据线性回归的结果,选择了前十个重要的特征, 可以发现 R2 降低了不少. 不过为了方便解释, 有时也可以降低一些模型的预测能力.

当然不准的模型就算能解释, 又能解释多准呢? 自己实践中权衡吧.

接着, 就可以按照下图方法, 查看模型参数了. 我们将选择的特征输出到另一个线性回归中, 然后将模型参数输出到数据表查看, 数据可以按照系数排序. 绝对值越大的系数, 其对应的特征影响越大. 可以看出, 橙现智能已经帮助我们将分类数据处理成了独热编码.

这部分我们完成了模型的进一步优化和模型解释, 读者可以进一步尝试优化模型. 下一部分, 我们将使用橙现智能解决分类问题.

文档有问题? 或者有其他意见和建议? 请在本文档的 Github 仓库直接反馈

进入反馈页面不知道如何反馈, 请点击这里