当前位置: 首页 > news >正文

专业的徐州网站开发南通网站建设培训

专业的徐州网站开发,南通网站建设培训,青岛网络seo公司,做网站月入5万文章目录 prompt概述推理#xff08;提问#xff09;技巧基础prompt构造技巧进阶优化技巧prompt自动优化 参考链接#xff1a; Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing预训练、提示和预测#xff1a;NL… 文章目录 prompt概述推理提问技巧基础prompt构造技巧进阶优化技巧prompt自动优化 参考链接 Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing预训练、提示和预测NLP中提示的系统综述 随着LLM时代的到来通过prompt直接对话语言模型得到预期结果解析后用于实际应用的模式也随之推广。那么什么是prompt如何用好prompt去激发语言模型的潜力成为了预训练语言模型底座prmpt-tuning范式的重要议题。 prompt概述 prompt通俗来说就是通过设计自然语言提示词让预训练的语言模型“回忆”预测出学习到的内容并对提示词的问题做出解答具体步骤如下 设计模版设计一个自然语言模版该模版中一个位置用于存放输入文本[X]一个位置用于存放输出文本[Z]根据模版构造问答样本如设计模版为[X] The movie is [Z]“输入内容[X]为I love this movie.”预测结果的位置为[Z]存放的位置通过这样的模式去构造样本 中间位置的为完形填空prompt还有前缀、后缀的prompt形式prompt并非局限于自然语言也可以是向量化后的token[X] 和 [Z] 槽位数量可以根据任务需要灵活调整 搜索回答这一步主要经大模型推理预测找到得分最高的结果 z ˆ zˆ zˆ。通过预训练的大模型可能会有一组允许的 Z Z Z生成任务可以是任意文本分类任务可以是一组单词被预测出来函数 f f i l l ( x ′ , z ) f_{fill}(x, z) ffill​(x′,z) x ′ x x′为根据模版构造的未填充结果的文本表示用潜在回答 z z z填充提示 x ′ x x′中的位置 [Z]得到的结果一般被称为 filled prompt如果填充的是正确回答则被称为 answered prompt具体表现为通过使用预训练的大模型计算会从相应filled prompt 从可能的回答集合 Z Z Z中找出概率最大的结果 z ˆ zˆ zˆ得到answered prompt 映射回答最后基于得分最高的回答 z ˆ zˆ zˆ 到得分最高的输出 y ˆ yˆ yˆ尤其是在分类任务中需要进行这样的结果映射比如excellent、fabulous、wonderful 等近义词可以映射到某一情感类别 推理提问技巧 prompt采用完形填空、前缀还是后缀的形式是预训练底座或者微调时需要考虑的当前就总结基于大模型完成推理提问时该如何设计prompt以及使用什么样的技巧才能更好地激发大模型的潜能。 基础prompt构造技巧 当提问的方式与大模型的语料库更接近时模型的预测效果可能会更好不过大多数大模型的语料库都是非公开的好在都是采用类似的模版设计因此能够总结出一定的规律。 想要在推理时得到较理想的预测结果结合很多prompt经验来看一个合理的架构就包含了构造prompt所需的技巧下面介绍一个ChatGPT3官方提出的prompt构造模版CRISPECapacity and Role、Insight、Statement、Personality、Experiment具体为 构造步骤技巧描述示例Capacity and Role指定角色和能力“假设你是一个机器学习架构开发专家并且还是一个资深博客作家。”Insight给定一些背景信息“博客的受众是有兴趣了解机器学习最新进展的技术专业人士。”Statement说明任务目标“全面概述最流行的机器学习框架包括它们的优点和缺点。包括现实生活中的例子和案例研究以说明这些框架如何在各个行业中成功使用。”Personality控制输出格式与风格“在回复时请使用 Andrej Karpathy、Francois Chollet、Jeremy Howard 和 Yann LeCun 的混合写作风格。”Experiment指定输出结果的要求如单输出/多输出“给出多个输出示例” 上述模版包含了很多构造prompt的技巧不同的模版侧重的技巧可能有差异但是都是可以用来尝试的范式其他更多的模版可以参考9个prompt构造模版范式 还有很多prompt的设计技巧避免模型出现幻觉等更好地得到目标输出结果比较基础简单的技巧如 提供更多的细节/背景信息描述更清晰避免模糊的表达多尝试不同的prompt构造范式选取最适合任务的一种提问方式采用效果好的prompt范式多次调用模型选出投票结果self-consistency把单个问题拆分成多个子问题一步一步地得到最终结果least to most知识增强通过检索引入外部知识构造prompt提升效果RAGRetrieval Augmented Generation把问题拆分成不同的问题后逐步进行提问self-ask等 # 采用langchain生成self-ask示例 # pip install langchain # pip install openai # pip install google-search-resultsimport os os.environ[OPENAI_API_KEY] str(xxxxxxxxxxxxxxxxxxxx) os.environ[SERPAPI_API_KEY] str(xxxxxxxxxxxxxxxxxxxx)from langchain import OpenAI, SerpAPIWrapper from langchain.agents import initialize_agent, Tool from langchain.agents import AgentTypellm OpenAI(temperature0) search SerpAPIWrapper() tools [Tool(nameIntermediate Answer,funcsearch.run,descriptionuseful for when you need to ask with search,) ]self_ask_with_search initialize_agent(tools, llm, agentAgentType.SELF_ASK_WITH_SEARCH, verboseTrue ) self_ask_with_search.run(What is the hometown of the reigning mens U.S. Open champion? ) # 输出self-ask示例 # Entering new AgentExecutor chain... # Yes. # Follow up: Who is the reigning mens U.S. Open champion? # Intermediate answer: Carlos Alcaraz # Follow up: Where is Carlos Alcaraz from? # Intermediate answer: El Palmar, Spain # So the final answer is: El Palmar, Spain # Finished chain. # El Palmar, Spain更多技巧可以参考以下内容 OpenAI官方技巧教程Reasoning with Language Model Prompting: A SurveyAwesome-Prompt-Engineering12 Prompt Engineering Techniques 如果模型的参数是可以通过入口传递的也可以通过参数设置调整模型的预测结果 温度系数Temperature控制模型输出随机性的参数。它影响模型在选择下一个词时的确定性越接近1时模型的输出越随机多样性top p采样策略模型仅从累计概率超过指定阈值p的最可能的词中进行选择。设置 top-p 为0.9模型将从概率最高的一小部分词中选择这些词的累计概率加起来接近0.9。重复惩罚penalty控制模型重复内容的输出在长篇回答或生成文章时使用重复惩罚可以帮助减少冗余和重复。 进阶优化技巧 上面提到的链接里有很多更细节/高阶的优化技巧下面主要是从两种现在应用比较广泛的范式出发来介绍进阶的优化技巧能更好地解决模型产生幻觉的问题。 把问题拆分成一步一步的小问题并逐步进行解答直到得到最终的目标结果。中间过程结合RAG就能够产出更稳定、准确性更高的模型预测结果 现在又很多AI-Agent如LangChain集成了这些大模型推理优化技巧还包含很多底层数据处理和检索等能力可以协助使用者更好地进行大模型应用提升模型的预测效果 CoT 论文链接Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 是一种引导大模型进行任务分解的提问方法作法是给出任务分解的少量示例利用大模型的上下文学习能力in-context learning引导模型进行任务拆解并得到目标结果如图所示 ReActReasonAct 论文链接React: Synergizing Reasoning and Acting in Language Models 引导大模型将问题进行更细致的拆分在不同的子问题阶段拆分出Thought、Act和Observation三步分步骤去检索/LLM推理并解答每个子步骤的问题把各个问题的流程拼接成大模型的最终输入让模型更有规划地去解决目标问题 ReWOOReasoning WithOut Observation 论文链接ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models 去掉了ReAct处理手段中的Observation阶段并且把Thought、Act转换成Planner、Worker和Solver三个阶段把问题拆分成不同的子问题Planner根据子问题去检索/LLM推理对应的结果Worker拼接各个子问题的问答输入给大模型得到目标问题的预测结果 ToTTree of Thought 论文链接Tree of Thoughts: Deliberate Problem Solving with Large Language Models ToT是结合了多种优化技巧的一种优化方案在解决复杂问题时具有更大的优势。CoT是基于问题将问题划分成多个子步骤并通过检索或者向大模型提问的方式得到各个步骤的结果而CoT则是在会基于初始问题拆分出多个一级问题每个问题会通过检索/LLM推理的方式解决以此类推就可以得到一颗树结构最终的结果通过广度优先搜素、深度优先搜索等方式来拼接每一步的内容最终输入给大模型得到目标答案 GoTGraph of Thought 论文链接Graph of Thoughts: Solving Elaborate Problems with Large Language Models 在ToT的基础上引入了循环refine的结构特定节点上可以想循环神经网络一样不断更新结果使得整个过程的调整空间更大 prompt自动优化 还有一些转为优化prompt设计的架构可以帮你优化提问的文本内容 AutoPromptEliciting Knowledge from Language Models with Automatically Generated PromptsPromptAgent: Strategic Planning with Language Models Enables Expert-Level Prompt OptimizationGuiding Large Language Models via Directional Stimulus PromptingSynthetic Prompting: Generating Chain-of-Thought Demonstrations for Large Language Models
http://www.dnsts.com.cn/news/12563.html

相关文章:

  • 云服务器可以做两个网站吗上海公司招聘信息查询
  • 毕设 做网站动易网站后台管理功能
  • 沭阳建设局网站软件项目管理课程
  • 建设视频网站设计意义成都网站建设招聘
  • 国外大气网站欣赏网站开发课程教学目标
  • 功能型网站多少钱最近的战争新闻大事
  • 我想弄个自己的卖货网站怎样做惠城网站设计
  • 源代码管理网站晋中市建设局网站
  • 沈阳网站制作系统互联网产品代理项目
  • 重庆网站建设重庆网站建设公司网站建设网站代码加密
  • 怎么搜索整个网站国家医保服务平台
  • 网站的制作方法wordpress 同步预览
  • 做网站云服务期做最漂亮的网站
  • 建站宝盒建网站成都网站建设哪里好
  • 网络营销导向网站建设的基础是什么动画设计电脑配置要求
  • 网站建设时间怎么查保山网站建设服务
  • 广州 建设 招聘信息网站网络营销概述ppt
  • 怎么用linux做网站英文版网站建设策划方案
  • 网站正在建设中 英语翻译海南网站建设设计
  • 广州h5设计网站公司简单好看的版面设计图
  • 东莞正规的人才市场aso推广优化
  • 龙岩做网站公司有哪些网站软件开发招聘
  • 沈阳网站建设联系方式360建筑网忘记登入密码了怎么办
  • WordPress搬家注意事项唐山网站建设优化
  • 网站后台流程图南京工程建设招聘信息网站
  • 企业网站管理源码交换链接营销
  • 做权重网站韶关手机网站建站
  • 做网站的图片取材wordpress建网站的优点
  • 怎样做ppt建网站install wordpress
  • 沈阳网站建设seo优化网站制作论文答辩