h5网站搭建,教育企业网站源码,网站怎么留住用户,建设网站公司 昆山RAG
输入问题#xff0c;在知识库匹配知识#xff0c;构建提示词#xff1a;基于{知识}回答{问题}
微调
用知识问答对重新训练大模型权重#xff0c;输入问题到调整后的大模型
如何选择 如果业务要求较高#xff0c;RAG和微调可以一起使用 1-动态数据
选择RAG
原因在知识库匹配知识构建提示词基于{知识}回答{问题}
微调
用知识问答对重新训练大模型权重输入问题到调整后的大模型
如何选择 如果业务要求较高RAG和微调可以一起使用 1-动态数据
选择RAG
原因RAG将数据存放到数据库即可微调需要重新训练模型微调成本大2-模型能力定制
选择微调
原因用户想要回答有特殊口吻/专业内容等如猫娘大模型/阅读研报/文本抽取内容微调可以定制回答3-幻觉
选择RAG
原因带有上下文知识的输入会减少模型幻觉的产生4-可解释性
选择RAG
原因RAG可以给用户输出知识库数据供参考提高回答可信度5-成本
选择RAG
原因RAG只需要构建出知识图谱/知识数据库即可而微调需要考虑数据集质量以及不断训练模型微调成本高6-依赖大模型通用能力
选择RAG
原因微调会改变大模型的权重提高模型专业能力但会降低模型通用能力模型遗忘7-延迟
选择微调
原因RAG会有如知识库检索、排序、匹配等操作会耗时8-智能设备
选择微调
原因移动端小模型业务场景需要突出专业能力