当前位置: 首页 > news >正文

一键建站源码无锡招标网官方网站

一键建站源码,无锡招标网官方网站,汕头建站方案,江苏路街道网站建设介绍#xff1a;首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库#xff0c;训练出一个具有中医知识理解力的预训练语言模型#xff08;pre-trained model#xff09;#xff0c;之后在此基础上通过海量的中医古籍指令对话数据及通用指令…介绍首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库训练出一个具有中医知识理解力的预训练语言模型pre-trained model之后在此基础上通过海量的中医古籍指令对话数据及通用指令数据进行有监督微调SFT使得模型具备中医古籍知识问答能力。 0.模型信息 Model Information Brief Introduction 姜子牙通用大模型V1是基于LLaMa的130亿参数的大规模预训练模型具备翻译编程文本分类信息抽取摘要文案生成常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。 pip install torch1.12.1 tokenizers0.13.3 githttps://github.com/huggingface/transformers 0.1继续预训练 Continual pretraining 原始数据包含英文和中文其中英文数据来自 openwebtext、Books、Wikipedia 和 Code中文数据来自清洗后的悟道数据集、自建的中文数据集。在对原始数据进行去重、模型打分、数据分桶、规则过滤、敏感主题过滤和数据评估后最终得到 125B tokens 的有效数据。 为了解决 LLaMA 原生分词对中文编解码效率低下的问题我们在 LLaMA 词表的基础上增加了 7k 个常见中文字通过和 LLaMA 原生的词表去重最终得到一个 39410 大小的词表并通过复用 Transformers 里 LlamaTokenizer 来实现了这一效果。 在增量训练过程中我们使用了 160 张 40GB 的 A100采用 2.6M tokens 的训练集样本数量和 FP 16 的混合精度吞吐量达到 118 TFLOP per GPU per second。因此我们能够在 8 天的时间里在原生的 LLaMA-13B 模型基础上增量训练 110B tokens 的数据。 训练期间虽然遇到了机器宕机、底层框架 bug、loss spike 等各种问题但我们通过快速调整保证了增量训练的稳定性。我们也放出训练过程的 loss 曲线让大家了解可能出现的问题。 0.2 多任务有监督微调 Supervised finetuning 在多任务有监督微调阶段采用了课程学习curiculum learning和增量训练continual learning的策略用大模型辅助划分已有的数据难度然后通过 “Easy To Hard” 的方式分多个阶段进行 SFT 训练。 SFT 训练数据包含多个高质量的数据集均经过人工筛选和校验 Self-Instruct 构造的数据约 2MBELLE、Alpaca、Alpaca-GPT4 等多个数据集 内部收集 Code 数据300K包含 leetcode、多种 Code 任务形式 内部收集推理 / 逻辑相关数据500K推理、申论、数学应用题、数值计算等 中英平行语料2M中英互译语料、COT 类型翻译语料、古文翻译语料等 多轮对话语料500KSelf-Instruct 生成、任务型多轮对话、Role-Playing 型多轮对话等 0.3 人类反馈学习 Human-Feedback training 为了进一步提升模型的综合表现使其能够充分理解人类意图、减少 “幻觉” 和不安全的输出基于指令微调后的模型进行了人类反馈训练Human-Feedback TrainingHFT。在训练中我们采用了以人类反馈强化学习RM、PPO为主结合多种其他手段联合训练的方法手段包括人类反馈微调Human-Feedback Fine-tuningHFFT、后见链微调Chain-of-Hindsight Fine-tuningCOHFT、AI 反馈AI Feedback和基于规则的奖励系统Rule-based Reward SystemRBRS等用来弥补 PPO 方法的短板加速训练。 我们在内部自研的框架上实现了 HFT 的训练流程该框架可以利用最少 8 张 40G 的 A100 显卡完成 Ziya-LLaMA-13B-v1 的全参数训练。在 PPO 训练中我们没有限制生成样本的长度以确保长文本任务的奖励准确性。每次训练的总经验池尺寸超过 100k 样本确保了训练的充分性。 1.训练数据 1.1 继续预训练数据纯文本语料约0.5G 包含两部分①中医教材数据收集“十三五”规划所有中医教材共22本。②在线中医网站数据爬取中医世家、民间医学网等在线中医网站及知识库。 通用指令微调数据 Alpaca-GPT4 52k 中文 alpaca_gpt4_data.json包含由 GPT-4 生成的 52K 指令跟随数据并带有 Alpaca 提示。该 JSON 文件与 Alpaca 数据具有相同的格式只是输出由 GPT-4 生成的 instruction: str描述模型应执行的任务。每条 52K 指令都是唯一的。 input: str任务的任选上下文或输入。 output: str指令的答案由生成GPT-4。 alpaca_gpt4_data_zh.json包含由 GPT-4 生成的 52K 指令跟踪数据并由 ChatGPT 翻译成中文的 Alpaca 提示。此 JSON 文件具有相同的格式。 comparison_data.json通过要求GPT-4评估质量对GPT-4、GPT-3.5和OPT-IML等透明模型的响应进行排名。 user_input: str用于查询LLM的提示。 completion_astr一个模型完成其排名完成_b。 completion_b: str不同的模型完成其质量得分较低。 unnatural_instruction_gpt4_data.json包含由 GPT-4 生成的 9K 指令跟随数据并带有非自然指令中的提示。此 JSON 文件与 Alpaca 数据具有相同的格式。 比较了两种指令调整的 LLaMA 模型分别根据 GPT-4 和 GPT-3 生成的数据进行微调。 在“有用性”标准中LLaMA-GPT-4 的表现明显优于 LLaMA-GPT-3。 LLaMA-GPT-4 在所有三个标准中的表现与原始 GPT-4 相似这为开发最先进的遵循指令的 LLM 提供了一个有希望的方向。 1.2 中医古籍指令对话数据 语料库来源 以《中华医典》数据库为语料来源约338MB由两部分组成①非结构化的“古籍文本”涵盖了886本标点符号及内容完整的中医古籍。②结构化的“古籍辞典”包含“名医”、“名言”、“名词”、“名著”等六大类由中医学界诸多知名学者对中医古籍内容知识进一步系统提炼整理是中医古籍内容精华最为直接的集中体现。 构建指令微调对话数据集通过知识引导的指令数据生成和指令数据质量优化两个阶段最终获得504372个对话数据。 知识引导的指令数据生成 让ChatGPT基于对该段中医古籍的知识内容理解模拟用户与AI通过自问自答的方式生成逻辑关系相关的若干问题和答案从而保证对话数据的准确性和可靠性。 指令数据质量优化 尽管基于知识引导使得生成的指令数据基于特定领域并且与所提供的无监督文本内容相关避免了模型内部“已有知识”的干扰。然而这种方法难以对数据质量进行监督和控制也难以保证指令数据的多样性和难度这可能导致大模型对指令数据集的过度拟合。为了解决这个问题我们在现有指令数据集的基础上通过指令数据过滤-指令数据整合两个阶段对数据进行二次优化。 中医古籍指令数据种类概览共504372条对话数据 2.模型训练 2.1实验参数 2.2模型下载-LoRA权重 3.模型效果 文章转载自汀、人工智能 原文链接https://www.cnblogs.com/ting1/p/18027272 体验地址引迈 - JNPF快速开发平台_低代码开发平台_零代码开发平台_流程设计器_表单引擎_工作流引擎_软件架构
http://www.dnsts.com.cn/news/88829.html

相关文章:

  • c mvc网站开发实例网站建设最花时间的是
  • 深圳罗湖做网站wordpress不同分类目录显示文章数量不同
  • 青岛微信网站制作食品销售公司网站制作
  • 网站建设兼职劳务协议天津高端网站建设企业
  • 创意工作室网站咨询网络服务商
  • 苏州网联盛网站建设深圳市住房与建设局招聘
  • 黑龙江住房建设部网站聊城做网站比较不错的公司
  • 哪个网站有做视频转场的素材百度关键词推广教程
  • 网站建设企划书wordpress繁简体
  • 快速建站教程中国核工业第五建设有限公司简介
  • 建立一个公司自己的网站在哪里创建网站
  • wordpress网站在哪里修改密码湖南长沙景点
  • 郑州金水区建设局网站汽车制作公司排名
  • 图书建设网站乐陵建设网站
  • 南城微网站建设怎么做亚马逊网站
  • 什么软件做网站最好北京网站建设公司报价浩森宇特
  • 网站品牌建设龙岩网站开发
  • 怎样用linux做网站美容院网站建设
  • 建立网站实验总结网站 为什么要备案
  • 网站是怎么建立的wordpress无法进入登录页
  • 购物网站商城王烨画家
  • 东莞公司网站建设小知识网页设计教程的资料
  • 网站推广技术南沙定制型网站建设
  • 网站正在建设中 英语翻译东营可以做网站的公司在哪
  • 竹子建站seo设置怎么做北京网站建设哪家好
  • 快速微信网站建设电子烟网站设计
  • 做外贸网站做成哪种形式好情感网站seo
  • 跨境出口电商网站wordpress主题免费和付费
  • 西安微信商城网站设计什邡移动网站建设
  • 深圳公司注销百度seo排名优化公司哪家好