建设个人技术网站,建设银行审计招聘网站,西安网站建设专业公司,网站站外推广方式有哪些通过这篇博客#xff0c;你将清晰的明白什么是F值、交叉验证。这个专栏名为白话机器学习中数学学习笔记#xff0c;主要是用来分享一下我在 机器学习中的学习笔记及一些感悟#xff0c;也希望对你的学习有帮助哦#xff01;感兴趣的小伙伴欢迎私信或者评论区留言#xff0… 通过这篇博客你将清晰的明白什么是F值、交叉验证。这个专栏名为白话机器学习中数学学习笔记主要是用来分享一下我在 机器学习中的学习笔记及一些感悟也希望对你的学习有帮助哦感兴趣的小伙伴欢迎私信或者评论区留言这一篇就更新一下《 白话机器学习中的数学——F值与交叉验证》 文章目录一、F值二、交叉验证一、F值
在之前的学习中我们已经学习了精确率Precision和召回率Recall有没有这样一个值能够综合得考虑这两个值呢如果只是简单地计算平均值并不算很好的方法。假设现在有两个模型它们的精确率和召回率是这样的 模型 B 的召回率是 1.0也就是说所有的 Positive 数据都被分类为 Positive 了但是精确率也实在是太低了。如果将所有的数据都分类为 Positive那么召回率就是 1.0。但是这样一来Negative 数据也会被分类为 Positive所以精确率会变得很低。看一下两个模型的平均值会发现模型 B 的更高。但它是把所有数据都分类为 Positive 的模型精确率极低仅为 0.02并不能说它是好模型。 所以就出现了评定综合性能的指标 F 值。下面表达式中的 Fmeasure就是 F 值Precision 是前面说的精确率Recall 是召回率。
精确率和召回率只要有一个低就会拉低 F 值该指标考虑到了精确率和召回率的平衡。计算一下前面两个模型的 F 值就知道了 除 F1 值之外还有一个带权重的 F 值指标 β 指的是权重我们可以认为 F 值指的是带权重的 F 值当权重为 1 时才是刚才介绍的 F1 值。带权重的 F 值更通用。F1 值在数学上是精确率和召回率的调和平均值。关于调和平均值不需要太深入地了解。
二、交叉验证
把全部训练数据分为测试数据和训练数据的做法称为交叉验证。这是非常重要的方法一定要记住哦。交叉验证的方法中尤为有名的是 K 折交叉验证掌握这种方法很有好处。
K 折交叉验证步骤如下
把全部训练数据分为 K 份将 K − 1 份数据用作训练数据剩下的 1 份用作测试数据每次更换训练数据和测试数据重复进行 K 次交叉验证最后计算 K 个精度的平均值把它作为最终的精度
假如我们要进行 4 折交叉验证那么就会这样测量精度 如果全部训练数据的量较大这种方法必须训练多次会比较花时间不切实际地增加 K 值会非常耗费时间所以我们必须要确 定一个合适的 K 值。