当前位置: 首页 > news >正文

lol怎么做直播网站网络营销的推广文案

lol怎么做直播网站,网络营销的推广文案,个人网站成品,如何做门户网站欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家#xff01; 预测系统的分类指标(精确率、召回率和 F1 值) 简介 让我们来谈谈预测系统的分类指标以及对精确率、召回…欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家 预测系统的分类指标(精确率、召回率和 F1 值) 简介 让我们来谈谈预测系统的分类指标以及对精确率、召回率和F1分数的直观解释。每当我们设计预测系统时无论是统计模型还是复杂的神经网络我们都希望看到它的表现如何。我们希望准确了解输出的质量不仅如此我们还希望能够将它们与其他当代或最先进的系统进行比较以证明我们的方法更优。 制定这样的比较并不简单。我们必须从多个角度提出质量问题这需要一个良好的指标来量化输出的质量使它们能够直接与其他方法进行比较并确保输入不变性。对于输入不变性这意味着处理特定类型数据的数据集或模型不应在任何其他类型的问题上具有偏见的优势。 输入不变性意味着无论模型处理的数据类型或问题是什么指标都应公平地评估性能。 基本定义 在开始讨论指标之前我们必须先了解一些基本的类别定义我们可以将输出分组到这些类别中。 假设我们有一个系统它对对象的类别进行预测我们称 正例 为我们感兴趣的标签或类别。 例1检测数据集中的错误。如果我们感兴趣的是测量识别错误情况的性能我们会将其归类为正例正常操作为负例。例2将项目分类为a、b、c和d四种不同类别。如果我们想测量与类别b有关的性能那么在这种情况下b是正例其他任何a、c和d都是负例。 关键点在于我们所有的指标都是针对我们选择定义为正例的类别。随着我们探索不同的指标这一区别变得重要和明显特别是对于多类别系统。 正例非常关键因为我们将讨论的所有指标都是针对我们选择定义为正例的类别。这意味着我们计算的性能度量将取决于我们认为的正例是什么。 在多类别系统中即有两个以上的类别定义正例变得尤为重要和明显。每个类别都可以单独作为正例进行评估这会影响最终的指标。 预测类别 基于这些定义我们可以将对某些数据所做的预测进一步划分为四个有用的组 真正例TP当标签为正且我们预测为正时。假正例FP当标签为负且我们预测为正时。真负例TN当标签为负且我们预测为负时。假负例FN当标签为正且我们预测为负时。 这些值通常表示为每个类别中的预测数量或相对于所有预测的百分比。 真正例、假正例、真负例和假负例的数量可以表示为原始数字或作为系统所做总预测数的百分比。 准确率 我们将从最基本的指标开始并正式定义什么是准确率。几乎每个人都应该对这一概念有近乎本能的理解。为了测量我们系统的准确率我们计算正确答案的数量并将其表示为我们给出的所有答案的一部分。更正式地通过我们之前的定义我们的系统的准确率是由整个预测集中的真正例和真负例的数量给出的。 Accuracy Total Correct Guesses Total Guesses T P T N T P T N F P F N \text{Accuracy} \frac{\text{Total Correct Guesses}}{\text{Total Guesses}} \frac{TP TN}{TP TN FP FN} AccuracyTotal GuessesTotal Correct Guesses​TPTNFPFNTPTN​ 准确率基本上告诉我们在所有的猜测中我们有多少答案是正确的值得注意的是这没有考虑猜测是关于正标签还是负标签。但是在测量性能时单纯的准确率有一个明显的问题这在处理偏差数据集时变得明显。 偏差示例 假设我们有一个数据集其中几乎所有的标签都是负的只有百分之一是正的。如果模型决定只输出负预测并且不做任何正预测它仍然会被计算为有99%的准确率。这不仅仅是一个玩具示例。在疾病检测或预测系统故障等场景中正常情况通常会大大超过任何异常情况。即使是具有较轻偏差的数据集其性能指标也可能以这种方式被扭曲只是稍微更微妙一些。 指标偏差 偏差偏差是指模型性能指标的扭曲或失真。这可能发生在指标未能准确反映模型的真实性能时通常是由于数据集不平衡。 微妙偏差在具有较轻不平衡的数据集中正负案例的分布不是极端偏差但仍不平衡准确率指标的扭曲可能不会立即显现出来。这种微妙的偏差意味着准确率指标仍然可能给出一个错误的乐观视图。 轻度不平衡数据集 在轻度不平衡的数据集中像准确率这样的性能指标的扭曲不像在高度不平衡的情况下那样明显因为准确率仍然相对较高但不平衡不足以使扭曲显而易见。 为什么它不那么明显 相对较高的准确率在轻度不平衡的数据集中80%的准确率不会立即显示出问题因为它看起来相当不错。不太极端的不平衡不平衡程度较轻因此准确率指标看起来不像在高度不平衡的情况下那样具有误导性高。隐藏的糟糕表现模型未能识别正例被更多的正确识别的负例所掩盖使得准确率的扭曲在乍一看不那么明显。 精确率 这时精确率这样的指标就派上用场了。精确率是衡量你对我们感兴趣的标签即正例的猜测有多准确。我们通过将正确的正例猜测数量除以所有的正例猜测数量来计算它。正式地是真正例的数量除以真正例加假正例的数量。 Precision Correct Positive Guesses Total Positive Guesses T P T P F P \text{Precision} \frac{\text{Correct Positive Guesses}}{\text{Total Positive Guesses}} \frac{TP}{TP FP} PrecisionTotal Positive GuessesCorrect Positive Guesses​TPFPTP​ 优化这个指标的系统的目标是尽可能少地在猜测正标签时犯错误。回到一个系统只会猜测所有东西都是负例的例子我们会看到精确率评分会惩罚模型因为它未能猜测任何正标签因此得分为零。 精确率的局限性 精确率仍然不能完全反映全貌因为它不考虑任何负标签。一个模型可以通过非常少的正预测并在这些少数情况下是正确的来获得高精确率。例如如果它只做一个正预测并且该预测是正确的 Precision 1 1 1 或  100 percent \text{Precision} \frac{1}{1} 1 \text{ 或 } 100 \ \text{percent} Precision11​1 或 100 percent 这个高精确率分数是误导性的因为模型可能没有做足够的正预测以在现实世界的场景中变得有用。 召回率 现在我们有了召回率它类似于精确率的对应指标。不同的是它将负标签纳入了方程。它询问你在所有存在的正标签中找到了多少正标签几乎直接解决了精确率的问题。这个方程归结为正确预测的正标签数量除以你正确预测的正标签数量加上你预测错误的正标签数量。 Recall Correct Positive Guesses All Positive Labels T P T P F N \text{Recall} \frac{\text{Correct Positive Guesses}}{\text{All Positive Labels}} \frac{TP}{TP FN} RecallAll Positive LabelsCorrect Positive Guesses​TPFNTP​ 系统的目标是尽可能找到所有存在的正标签。 召回率的局限性 召回率仍然有一个问题那就是通过自由地将任何事物标记为正例来扭曲分数。在极端情况下只需将所有事物标记为正例就不会有任何假负例从而获得完美的召回率分数。 Recall TP TP FN 10 10 0 1 或  100 percent \text{Recall} \frac{\text{TP}}{\text{TP} \text{FN}} \frac{10}{10 0} 1 \text{ 或 } 100 \ \text{percent} RecallTPFNTP​10010​1 或 100 percent 为什么召回率是精确率的对应指标 精确率 vs. 召回率 精确率精确率衡量预测的正例中有多少实际上是正例。它关注正预测的准确性。召回率召回率衡量实际正例中有多少被模型正确识别。它关注正预测的完整性。 由于精确率和召回率关注模型性能的不同方面它们被认为是对应指标。提高其中一个有时会导致另一个的下降因此它们相互平衡。 平衡精确率和召回率 现在应该很清楚仅仅依靠精确率和召回率都有一些严重的缺陷但事实上一种指标防止了对另一种指标的作弊。为了获得100%的召回率将导致精确率为零反之亦然。通过这种方式这两个指标相互补充提出了一个问题我们是否可以设计一个系统同时优化这两个分数。我们希望将预测的质量和完整性结合成一个分数。 虽然精确率关注正预测的正确性但召回率关注正预测的完整性。 精确率和召回率之间的权衡: 当你调整将实例分类为正例的阈值时会对精确率和召回率产生影响通常是相反的方向 提高精确率: 为了提高精确率你可能会设置更高的阈值来将实例分类为正例。这意味着模型在标记正例时会更加保守从而减少假正例FP。然而这种保守性也意味着它可能会错过一些真正例TP从而降低召回率。 示例: 一个分类电子邮件为垃圾邮件的模型可能非常保守只有在非常确定时才将电子邮件标记为垃圾邮件。这减少了非垃圾邮件被错误标记为垃圾邮件的数量高精确率但可能会错过一些实际的垃圾邮件低召回率。 提高召回率: 为了提高召回率你可能会设置更低的阈值来将实例分类为正例。这使得模型在标记正例时更加宽松从而减少假负例FN。然而这种宽松性增加了将非正例标记为正例的可能性从而降低精确率。 示例: 同样的垃圾邮件分类器可能会更宽松地标记电子邮件为垃圾邮件捕捉更多的实际垃圾邮件高召回率但也会错误地标记更多非垃圾邮件低精确率。 F1分数 这就是F1分数的作用。F1分数定义为精确率和召回率的调和平均数。该分数基本上询问预测的质量有多好以及我们从数据集中预测标签的完整性。重要的是F1分数并不简单地使用算术平均数来组合分数。事实上这对于我们之前讨论的所谓作弊情况会是相当不利的。调和平均数将分数偏向两个组成分数中较低的一个这实际上惩罚了精确率和召回率彼此之间的严重不一致并正确反映了当它们中的任何一个接近零时的情况。 F1 2 ⋅ Precision ⋅ Recall Precision Recall 2 ⋅ T P 2 ⋅ T P F P F N \text{F1} 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} \text{Recall}} 2 \cdot \frac{TP}{2 \cdot TP FP FN} F12⋅PrecisionRecallPrecision⋅Recall​2⋅2⋅TPFPFNTP​ 为什么F1分数不使用算术平均数 考虑以下场景 数据集: 10个正例和90个负例模型预测: 预测所有为正例 结果预测为 真正例TP: 10假正例FP: 90真负例TN: 0假负例FN: 0 计算精确率和召回率 精确率: T P T P F P 10 10 90 0.1 \frac{TP}{TP FP} \frac{10}{10 90} 0.1 TPFPTP​109010​0.1召回率: T P T P F N 10 10 0 1 \frac{TP}{TP FN} \frac{10}{10 0} 1 TPFNTP​10010​1 精确率和召回率的算术平均数为 0.1 1 2 0.55 \frac{0.1 1}{2} 0.55 20.11​0.55 这个结果误导性地表明了中等表现。然而作为精确率和召回率的调和平均数F1分数计算如下 F 1 2 × 0.1 × 1 0.1 1 ≈ 0.18 F1 2 \times \frac{0.1 \times 1}{0.1 1} \approx 0.18 F12×0.110.1×1​≈0.18 这表明F1分数通过惩罚精确率和召回率之间的极端不平衡更准确地反映了模型的糟糕表现。 结论 F1分数是我们比较系统的最常用指标之一在大多数情况下它是衡量模型性能的良好指标。然而在一些情况下尤其是处理多类别系统时它并不那么适用因为对于每个不同类别的性能同样重要。此外该指标在计算中不包含真负例因为精确率和召回率分别不包括它们。 通常在二分类问题中一个类别是主要关注的。这通常是正类例如检测欺诈、识别疾病或识别垃圾邮件。示例在疾病检测中主要关注的是识别疾病病例正类。错过一个疾病病例假负例通常比错误地将一个健康人识别为疾病患者假正例更为严重。 在多类别分类中有两个以上的类别并且每个类别的性能同样重要。示例在图像分类任务中类别如猫、狗和鸟将猫错误分类为狗与将狗错误分类为鸟同样重要。 参考资料: 在YouTube上观看视频
http://www.dnsts.com.cn/news/133273.html

相关文章:

  • 嘉兴娱乐网页设计冯耀宗seo
  • 网站图片幻灯片效果凤山网站seo
  • 注册越南网站vn郑州软件开发外包
  • 个人网站域名备案怎么下载ppt模板
  • dedecms网站的下载外贸跨境电商平台有哪些
  • 局强化网站建设和管理网上交易平台网站建设公司
  • 室内设计网站案例陕西电商网站建设
  • 贵阳网站备案南方人才网
  • 网站截流做cpa广告设计在线
  • 重庆网站建设培训机构wordpress 标签云链接
  • 上传网站图片处理上海市网站建设电话号码
  • 网站开发项目技能比赛获奖报道上海关键词优化报价
  • 网站图片加水印作文网站高中
  • 邢台wap网站建设微信小店怎么开通
  • 下载类网站模板动画设计与制作主要学什么
  • 中国空间站完成图环球军事头条
  • 无icp备案的网站合法吗修改WordPress的配置文件
  • 旅游网站的广告预算怎么做网站app建设需要资源
  • 开个网站多少钱一年怎么更换网站图片
  • 南宁网站建设seo优化营销制作电商的网站设计
  • 北京外贸网站优化wordpress产品页面模板下载
  • 空间代码网站有经验的南昌网站设计
  • 网站建设的国内外现状页面具有动态效果网站建设
  • 网站怎么查看访问量全国工商网站查询企业信息
  • 网站设置合理的内链机制深圳皇冠科技有限公司网站
  • 单页营销网站设计第三方物流网站建设
  • 台州免费做网站wordpress单页主题营销
  • 哪里有做杂志的免费模板下载网站适合网站设计的gif图片
  • 网站建设 外文文献网站建设注册
  • 建网站需要多少钱2017免费咨询医生皮肤科专家