当前位置: 首页 > news >正文

asp网站如何虚拟发布做幼儿网站的目标

asp网站如何虚拟发布,做幼儿网站的目标,杭州哪些做网站公司好,宜昌哪里有做网站的概述 随着大规模语言模型的兴起#xff0c;自然语言处理领域取得了重大发展。这些创新的模型允许用户通过输入简单的 提示 文本来执行各种任务。然而#xff0c;众所周知#xff0c;在问题解答#xff08;QA#xff09;任务中#xff0c;用户在处理长文本时…概述 随着大规模语言模型的兴起自然语言处理领域取得了重大发展。这些创新的模型允许用户通过输入简单的 提示 文本来执行各种任务。然而众所周知在问题解答QA任务中用户在处理长文本时会面临信息 丢失 的问题。 最近支持超长语境的大规模语言模型已经发布如 GPT-4 Turbo 和 Claude-2.1它们分别支持 128k 和 200k 标记的语境窗口。虽然这些大规模语言模型支持长上下文但当输入提示非常长时它们的响应质量往往会下降Liu 等人2023 年发现即使是 16k 标记上下文如果相关上下文位于文档的中间也会出现问题。Liu 等人2023 年发现在基于文档的大型语言模型质量保证中如果相关上下文位于文档中间即使是 16k 标记上下文准确率也会明显低于开始和结尾。这种现象被称为迷失在中间。 为了解决这个问题本文提出了一种新的方法–RR它结合了 重新提示 和 “上下文检索”。这种方法允许在整个文档中重复问题指示从而有效地提取最相关的信息。其目的是提高 QA 的准确性以及大型语言模型在长语境中的性能。 论文详细介绍了这一创新方法的工作原理并提出了在长时间的质量保证任务中减少 中间丢失 效应的有效策略。通过实验论文还展示了 重新提示 和 上下文检索 在使用大规模语言模型方面的新潜力。这些方法在处理长句时提高了准确性和效率从而有可能扩大 NLP 技术的应用范围。 技术 本文重点介绍了基于文档的问题解答QA任务并提出了一种使用大规模语言模型的创新方法。 这种方法要求大规模语言模型根据给定文档的上下文回答问题。为此提示被分为三个部分以明确说明。首先标记问题及其答案说明然后标记文档本身。 最后在大规模语言模型生成答案之前再次重复指令。这种重复是基于以前的方法目的是在不丢失文档信息的情况下有效地引导回答。 它还假定文档被分为 “页”。这些页面与文档中的自然分隔符如段落和句子相对应为标准化起见称为页面。PAGE {p} . . . /PAGE {p} 标记其中 {p} 由相应的页码代替。这种方法允许大规模语言模型更有效地处理整个文档并精确提取与问题相关的信息。 此外还引入了一种名为重新提示的技术。这种技术旨在减少 迷失在中间 现象即大型语言模型偏向于文档的开头或结尾或靠近关键指令。在重新提示中INSTRUCTIONS_REMINDER 你的任务是. . . /INSTRUCTIONS_REMINDER 时会在 PAGE 块外为文档中的每个指定标记插入一个提醒块其中包含几乎是逐字记录的原始指令。这有望缩短文档中任何地方的相关信息与说明之间的距离并提高大规模语言模型中应答的准确性。 此外还引入了上下文检索和分块技术。上下文检索基于这样一种理念即从文件中提取与问题相关的信息通常比直接回答问题要简单。这是因为在信息提取过程中可重复性比准确性更重要。这一过程分两个阶段进行首先确定与问题最相关的页面然后使用仅包含这些页面的缩写文档来回答问题。这种方法旨在让大规模语言模型高效处理信息。它还结合了重新提示和上下文检索以确保在提取文档中间的重要信息时不会遗漏任何内容。具体来说通过在整个文档中提醒搜索指令大规模语言模型有助于找到埋藏在中间的相关页面。 分块技术还能将文档划分为非重叠、连续的块并独立执行上下文内检索。这样就能有效地提取最相关的信息在保持准确性的同时减少 LLM 调用的次数。如果信息块足够大还可以在信息块内执行重新提示从而进一步优化准确性和效率之间的平衡。这样就有可能为更复杂的文档提供更高的性能。 实验和结果 本文研究了 RR 在基于文档的问题解答QA任务中的有效性。下表总结了每个数据集和长文本方法不包括分块法在不同文档长度d下获得的模糊匹配分数。往往会提高准确率。 重新提示的额外成本极低在 d80k 时比基线多消耗约 1.15%的输入令牌但在输出令牌方面没有额外成本RR 同样在 d80k 时比基线多消耗约 1.15%的输入令牌但平均每个样本需要 83 个输出令牌平均每个样本需要 83 个输出令牌。它需要在 ICR 步骤中额外调用一个大型语言模型平均每个样本需要 83 个输出词块。与基线和重新提示情况下的 43 个输出词组相比这个数字偏高。不过这些结果表明在基于文档的质量检测中RR可以有效扩展大规模语言模型的有效语境范围。 此外还进行了分块式 ICR 和分块式 RR增加了重新提示以比较较长上下文和重新提示与较短上下文和基于分块的方法的优势。下表显示了每个数据集和每种方法的模糊匹配得分其中改变了进行 ICR 和 RR 时的语块大小c。 一般来说对于大多数数据集来说随着数据块大小的增加准确率往往会下降因为额外的填充上下文会降低搜索准确率。不过有研究表明重新提示实际上可以使用更大的数据块随着数据块大小的增加准确率的损失也会减少。 这对准确性/成本的权衡有重要影响。较小的语块需要更多的 LLM 调用每个语块一次聚合后进行 QA、输入标记和输出标记。特别是输出标记的成本很高相当于 GPT-4 Turbo 中输入标记价格的三倍而且大型语言模型的执行时间会随着输出标记的增加而线性增加。因此有人建议重新提示可以通过允许更大的语块来减轻这种权衡从而减少对大型语言模型的调用和输出令牌的需求同时将准确性的损失降到最低。此外虽然重新提示本身需要少量额外的输入标记但这一成本可被大块输入标记的减少所抵消。 这种上下文内检索ICR方法也是基于这样一个假设从文件中提取最相关的页面比直接回答问题更容易。在前一种情况下原因是可重复性优先于准确性。我们通过比较直接基于文档的质量保证和 提取最相关的页面来回答问题 的任务来验证这一假设。我们将 NQ 排除在实验之外因为初始页面包含误导性信息将 HotPotQA 排除在外因为相关上下文分散在多个页面中。然而SQuAD 和 PubMed 显示在文档长度 d 40k 的示例中页面提取的准确性明显高于直接回答问题。 关于重试频率我们验证了每 10k 个标记的选择并发现这在所有数据集中都能达到最高的 QA 准确率。 关于重新提示的位置我们测试了这样一个假设只在紧接着相关上下文之前重新提示可以显著提高准确率。特别是在文档长度为 d 40k 的三个数据集中在标记为包含 黄金段落 的 PAGE 块之前插入单个 INSTRUCTIONS_REMINDER 块的方法均匀地优于每 10k 个重复提示的方法。比均匀每 10k 个词组重新提示一次的方法获得了更高的质量保证准确率。这表明重新提示是通过缩短相关上下文与任务指令之间的距离来发挥作用的。 此外他们还发现仅仅暗示原始指令的重复提示比原始提示的效果更差。这表明重要的是提示不仅要重复还要缩短问题与相关语境之间的距离。最后将提示块放在文档开头的重新提示测试结果明显不如原始重新提示。这些结果表明重新提示不是简单的重复而是由于特定的策略性位置而产生了效果。 总结 本文开发了一种基于提示的方法 RR以探索在基于文档的问题解答QA任务中提高大规模语言模型处理长句性能的潜力。研究发现这种方法在减少中间丢失 方面特别有效。此外还有人认为重新提示是通过最小化相关上下文与任务指令之间的距离来发挥作用的。 对于提取类型的质量保证任务而言分块方法提供了坚实的基础但也有可能以分块的方式进行重复性和再现性分析。即使在这种情况下我们也发现重新提示是有益的通过允许使用较大的分块减少了对大型语言模型的调用次数最大限度地减少了标记的使用同时在平衡准确性和成本时限制了准确性损失的 RR、在准确性至关重要的实际应用中分块方法的灵活性和成本节约 未来的研究方向多种多样前景广阔将 RR 与其他基于提示的方法相结合可进一步提高性能。还可以考虑 上下文分块 等新方法以进一步优化准确性/成本的权衡。将重新提示法应用于需要对文档有更全面理解的任务如摘要制作也可以开辟新的研究领域。最后虽然这些只是基于提示的方法但深入了解这些方法的优势和局限性可以揭示大规模语言模型在处理较长文本时的行为并为促进进一步改进的架构变革提供提示。 注 论文地址https://arxiv.org/abs/2403.05004 源码地址https://github.com/casetext/r-and-r
http://www.dnsts.com.cn/news/197561.html

相关文章:

  • 普通网站和营销型网站的区别男女做那个的网站是什么
  • 网站报名怎么做南昌住房城市建设支行官方网站
  • 怎么在网站做推广和宣传沾益县住房和城乡建设局网站
  • 怎样推广网站平台工信部网站备案要先做网站吗
  • 工信部门备案网站重庆景点攻略
  • 中山专业网站建设公司软件开发合同模板免费
  • 现在做网站用什么语言好电脑网页打不开
  • python是做网站的吗石家庄百度搜索引擎优化
  • 阎良做网站的公司wordpress带会员中心
  • 以域名做网站关键词少部分网站ie打不开这些网站域名ping不通
  • 网站建设先有域名然后呢万网查询全部域名
  • 上传产品网站怎么做网站管理系统安装
  • 荣成市信用建设网站手机商场网站制作
  • 5a景区网站建设最好的免费软件网站建设
  • 山西省建设厅勘察设计协会网站在百度怎么发布作品
  • 自助网站建设哪家好制作广告
  • jsp ajax网站开发典型实例pdf太原seo推广优化
  • 东阿网站建设公司建设网站上申请劳务资质吗
  • 做网站设计制作公司定制网站开发报价
  • 婚纱摄影网站建设方案wordpress 轮播图插件
  • 建设外贸商城网站制作澧县网页设计
  • 做犯法任务的网站qq电脑版官方网站
  • 网站后台怎么添加模板北京顺义做网站
  • 网站目录结构图柳州seo关键词优化
  • 58同城通辽做网站html网页代码编辑器
  • 网站建设服拼多多网站首页
  • wordpress做购物网站wordpress中文广告插件
  • 用ps做网站商用图片的网站
  • 南京做网站需要多少钱2345网址导航官网下载大全
  • wordpress地址如何修改优化网站要怎么做