四川交投建设招标网站,网站制作公司业务发展方案,电子商务网站建设规划心得,好用的搜索引擎有哪些模型可解释性汇总简 介目前很多机器学习模型可以做出非常好的预测#xff0c;但是它们并不能很好地解释他们是如何进行预测的#xff0c;很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的#xff0c;因为如果我们无法知道某个算法是如何进行预测但是它们并不能很好地解释他们是如何进行预测的很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的因为如果我们无法知道某个算法是如何进行预测那么我们将很难将其前一道其它的问题中很难进行算法的debug。本文介绍目前常见的几种可以提高机器学习模型的可解释性的技术包括它们的相对优点和缺点。我们将其分为下面几种Partial Dependence Plot (PDP)Individual Conditional Expectation (ICE)Permuted Feature ImportanceGlobal SurrogateLocal Surrogate (LIME)Shapley Value (SHAP)六大可解释性技术01Partial Dependence Plot (PDP)PDP是十几年之前发明的它可以显示一个或两个特征对机器学习模型的预测结果的边际效应。它可以帮助研究人员确定当大量特征调整时模型预测会发生什么样的变化。上面图中轴表示特征的值轴表示预测值。阴影区域中的实线显示了平均预测如何随着值的变化而变化。PDP能很直观地显示平均边际效应因此可能会隐藏异质效应。例如一个特征可能与一半数据的预测正相关与另一半数据负相关。那么PDP图将只是一条水平线。02Individual Conditional Expectation (ICE)ICE和PDP非常相似但和PDP不同之处在于PDP绘制的是平均情况但是ICE会显示每个实例的情况。ICE可以帮助我们解释一个特定的特征改变时模型的预测会怎么变化。如上图所示与PDP不同ICE曲线可以揭示异质关系。但其最大的问题在于它不能像PDP那样容易看到平均效果所以可以考虑将二者结合起来一起使用。03Permuted Feature ImportancePermuted Feature Importance的特征重要性是通过特征值打乱后模型预测误差的变化得到的。换句话说Permuted Feature Importance有助于定义模型中的特征对最终预测做出贡献的大小。如上图所示特征f2在特征的最上面对模型的误差影响是最大的f1在shuffle之后对模型却几乎没什么影响生息的特征则对于模型是负面的贡献。04Global SurrogateGlobal Surrogate方法采用不同的方法。它通过训练一个可解释的模型来近似黑盒模型的预测。首先我们使用经过训练的黑盒模型对数据集进行预测然后我们在该数据集和预测上训练可解释的模型。训练好的可解释模型可以近似原始模型我们需要做的就是解释该模型。注代理模型可以是任何可解释的模型线性模型、决策树、人类定义的规则等。使用可解释的模型来近似黑盒模型会引入额外的误差但额外的误差可以通过R平方来衡量。由于代理模型仅根据黑盒模型的预测而不是真实结果进行训练因此全局代理模型只能解释黑盒模型而不能解释数据。05Local Surrogate (LIME)LIMELocal Interpretable Model-agnostic Explanations和global surrogate是不同的因为它不尝试解释整个模型。相反它训练可解释的模型来近似单个预测。LIME试图了解当我们扰乱数据样本时预测是如何变化的。上面左边的图像被分成可解释的部分。然后LIME 通过“关闭”一些可解释的组件在这种情况下使它们变灰来生成扰动实例的数据集。对于每个扰动实例可以使用经过训练的模型来获取图像中存在树蛙的概率然后在该数据集上学习局部加权线性模型。最后使用具有最高正向权重的成分来作为解释。06Shapley Value (SHAP)Shapley Value的概念来自博弈论。我们可以通过假设实例的每个特征值是游戏中的“玩家”来解释预测。每个玩家的贡献是通过在其余玩家的所有子集中添加和删除玩家来衡量的。一名球员的Shapley Value是其所有贡献的加权总和。Shapley 值是可加的局部准确的。如果将所有特征的Shapley值加起来再加上基值即预测平均值您将得到准确的预测值。这是许多其他方法所没有的功能。该图显示了每个特征的Shapley值表示将模型结果从基础值推到最终预测的贡献。红色表示正面贡献蓝色表示负面贡献。小结机器学习模型的可解释性是机器学习中一个非常活跃而且重要的研究领域。本文中我们介绍了6种常用的用于理解机器学习模型的算法。大家可以依据自己的实践场景进行使用。