当前位置: 首页 > news >正文

长春网站建设q479185700強企网

长春网站建设q479185700強,企网,阿里云网站备案拍照,wordpress phonegap“学习是一个从围观到宏观#xff0c;从宏观到微观的一个过程” 学习大模型技术也有几个月的时间了#xff0c;之前的学习一直是东一榔头#xff0c;西一棒槌#xff0c;这学一点那学一点#xff0c;虽然弄的乱七八糟#xff0c;但对大模型技术也算有了一个初步的认识。…“学习是一个从围观到宏观从宏观到微观的一个过程” 学习大模型技术也有几个月的时间了之前的学习一直是东一榔头西一棒槌这学一点那学一点虽然弄的乱七八糟但对大模型技术也算有了一个初步的认识。 因此今天就来整体梳理一下大模型技术的框架争取从大模型所涉及的理论技术应用等多个方面对大模型进行梳理。 01 — 大模型技术梳理 这次梳理大模型不仅仅是大模型本身的技术而是一个以大模型为核心的涉及到多个方面的理论技术和应用实践也可以说是对自己学习大模型技术的总结吧。 话不多表下面开始进入正题。 首先大家应该明白一件事大模型技术是人工智能技术的一个分支是目前主流的一个研究方向但并不是唯一的方向。 人工智能技术是一个通过某种技术手段人为的创建一个具有类人智能的系统(软件或硬件)而大模型技术是一种仿造人类学习进化的一种方式使用深度学习(机器学习)算法模仿人类大脑神经元来实现智能的一种方式其主要载体是神经网络。 神经网络之所以得到发展的原因是因为基于神经网络架构进行预训练之后神经网络会产生一种无法解释的涌现能力而这个涌现能力特别像是具有了智能一样。 神经网络模型架构 既然是模仿神经网络那么就需要一种深度学习模型来模仿人类大脑神经系统比如CNN(卷积神经网络)RNN(循环神经网络)以及目前主流的Transformer模型还有LSTMResNetGANs等。 神经网络的主要结构为一个输入层一个输出层以及隐藏层(一个或多个层组成)不同网络层之间使用全连接的方式进行连接每一个圆都代表着一个神经元如下图所示 在神经网络中除了输入/输出层之外每一个神经元都有其参数神经网络的效果就是由这些参数值决定的。 神经网络模型通过一种叫正向传播损失计算和反向传播的方式来调整神经网络模型中每个神经元的参数。 通过把大量的训练数据输入到神经网络中让神经网络进行“学习”(不断的调整参数)来达到类智能的能力。 不同神经网络的架构和实现有所不同但其核心点都是基于此模型实现的对想学习神经网络的朋友来说先学会基础的神经网络架构然后再针对不同的神经网络模型进行深化是最好的选择。 目前的大模型主要采用的是预训练的方式来实现智能的简单来说就是给神经网络模型一堆资料让它自己学自己看自己总结其中给答案的叫做监督学习没答案的叫无监督学习。 然后根据不同的任务需求又设计出用来解决不同类型任务的神经网络比如分类任务图片处理任务自然语言处理任务等。 至于大模型技术细节方面的东西就不详细描述了感兴趣的可以自己学习比如编码器损失计算和反向传播怎么实现等。 再有设计并训练一个完整可用的神经网络模型是一个复杂的工程比如模型的设计训练数据的收集与处理损失函数与反向传播算法的设计模型过拟合欠拟合等问题。 而且随着模型规模的增大模型的训练难度成几何式增长比如分布式训练并行计算等问题以及为了提升大模型的学习效率节约成本而设计的强化学习迁移学习等。 最后为了使得大模型更像人也为了实现真正的AGI(通用人工智能)现在多模态大模型大行其道而多模态大模型技术比传统大模型的技术复杂度又上升了不止一个台阶。 基于知识库的向量检索——RAG 大模型技术虽然很强大但其有几个明显的缺点第一就是知识是有限制的因为采用的是预训练方式因此大模型的知识最多只能到训练开始的时间节点之后产生的新的知识大模型无法获取。 其次由于训练大模型的成本问题导致很多企业无法承担大模型的训练成本因此只能使用第三方的大模型但第三方大模型没有在特定领域的数据上进行训练或微调因此其表现能力一般。 这时RAG就出现了RAG中文是检索增强是通过外挂知识库的方式提问大模型之前先从向量数据库中查询数据然后一起输入到大模型这样大模型就相当于有了一个外部资料库遇到不懂的问题就可以通过查资料的方式解决。 以目前的技术来说RAG是大模型技术的一个重要节点即是大模型能力范围的扩展也是对大模型短板的补充。 微调与提示词工程 我们一般使用的大模型都是预训练模型也就是用某些数据集训练过的模型但这些模型一般情况下只会在特定领域表现出色但如果用来解决自己的实际问题可能就不太好用了。 这时怎么让预训练模型在其它任务中表现更好就是一个值得思考的问题而这就是微调与提示词工程存在的意义。 微调 微调从技术手段上来说和模型训练没有区别只不过微调是在相似任务的预训练模型的基础之上通过少量的数据对模型参数进行调整使得其能够更加适应当前任务的一种方式。由于其成本低对资金和技术要求要比完全重新设计和训练一款模型要低的多。 因此微调存在的意义是为了节约成本和降低门槛如果资金充足的情况下根据任务需求设计并训练一款模型是最好的选择微调是退而求其次的一种方式。 提示词工程 如果说微调是为了让大模型去适应特定的任务那么提示词的作用就是怎么更好的使用一个大模型。 根据研究发现对待同样的问题使用不同的提示词有时会得到完全不一样的效果因此根据这一现象就提出了提示学习的方法。 用人类来举例就是假如有人问你吃饭了吗这种简单的问题你可以下意识的回答而且可以回答的很好大模型也是如此如果你问大模型很简单的问题它也能回答的比较好。 但如果问到一些复杂的问题就需要更加准确的描述比如说根据当前的就业环境从经济市场贸易国际局势等多个方面来分析一下产生当前情况的原因以及后续的应对方法。 这种复杂的问题不论是问人还是问大模型你说的越准确它回答的才能更好这就是提示词存在的意义。 智能体Agent 在前面的描述中神经网络架构讲的是怎么构建一个大模型知识库是怎么补充和强化大模型微调和提示词是怎么更好的使用大模型那么智能体就是真正的使用大模型研究大模型的具体应用。 如果把大模型比做人类的大脑那么智能体就是大模型的手和脚。 在此之前使用大模型我们能够让它回答问题写文章生成图片和视频但这都是大模型天生具备的能力就类似于人类可以写写画画一样。 但如果让大模型完成更加复杂的任务这时就需要借助外部工具比如外出旅行需要设计旅行路线定酒店和车票等。 这种任务就完全超出大模型或者人类本身的能力圈如果想完成这些任务就需要借助外部工具比如说手机APP。 智能体就是大模型外部工具实现的一种能够独自分析和解决复杂任务的一种载体利用大模型的独立规划能力让它根据自己的判断去调用外部工具完成任务。 使用的技术主要有function calllangchain等如上图所示大模型使用function call的方式调用外部工具使用自身能力完成规划和行动并且由于大模型没有足够的记忆能力需要增加记忆模块来记录对复杂任务的分析过程。 目前大模型解决复杂任务主要通过思维链(CoT)的方式来实现对复杂问题的分解。 langchain是一种人工智能开发框架它封装了大部分调用大模型的细节以及其它辅助功能比如文档的加载多个大模型的链式调用提示词模板的封装等与其类似的还有LlamaIndex等。 总结 从大的方向上来说大模型从技术到应用主要涉及到以上几个大的模块而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型强化学习迁移学习知识蒸馏分布式训练与存储等以及RAG使用的向量检索向量数据库语义理解等还有复杂任务的思维链(CoT)模型训练使用的LoRa等微调方法。 还有多模态模型中的知识对齐数据融合等复杂技术。 基于大模型开发的人工智能机器人感兴趣的可以点击查看 因此大模型技术到应用到学习是一个系统性的复杂过程中间涉及到无数的技术细节和理论并且还在不断的产生新的技术和理论。 ​ 如何学习AI大模型 作为一名热心肠的互联网老兵我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。 这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】 一、全套AGI大模型学习路线 AI大模型时代的学习之旅从基础到前沿掌握人工智能的核心技能 二、640套AI大模型报告合集 这套包含640份报告的合集涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师还是对AI大模型感兴趣的爱好者这套报告合集都将为您提供宝贵的信息和启示。 三、AI大模型经典PDF籍 随着人工智能技术的飞速发展AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型如GPT-3、BERT、XLNet等以其强大的语言理解和生成能力正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。 四、AI大模型商业化落地方案 作为普通人入局大模型时代需要持续学习和实践不断提高自己的技能和认知水平同时也需要有责任感和伦理意识为人工智能的健康发展贡献力量。
http://www.dnsts.com.cn/news/114221.html

相关文章:

  • 营销网站设计公司招聘常用网站开发语言的优缺点
  • 网站开发最新流程住房和城乡建设部网站办事大厅里边
  • 如何帮人做网站赚钱手机端网站怎么制作
  • 广州建网站报价安徽省住房与城乡建设部网站
  • 教育公司 网站建设官网html模板
  • 网站网站建设多少钱网站建设 有哪些费用
  • 基础微网站开发公司建网站网络公司
  • 淘宝客 备案 网站名称网站建设中翻译
  • 网站开发所需人员wordpress很安全
  • 试玩网站设计建设wordpress 下载插件
  • 自动生成网站建设项目自主验收验收网站
  • 网页制作与设计代码Wordpress图片加载优化
  • 电子商城网站源码淮北网站网站建设
  • 临沂网站建设公司网站建设旗帜条幅
  • 微信微网站开发报价单深圳高端网站制作
  • 通化网站建设公司淘客网站代理
  • 返利网 网站建设费用广州网站优化公司咨询
  • 高端网站建设 来磐石网络泰安搜索引擎优化招聘
  • 网站做镜像检查漏洞康复网站模板怎么做
  • 国内公司网站模板山西城乡与住房建设厅网站
  • 商业门户网站有哪些网站建设杭州公司
  • 不要钱做网站软件网站开发蓝云
  • 迁西网站建设上海网站建设多少费用
  • 广告网站搭建商城网站租服务器安全不
  • 如何做响应式网站百度贴吧网页版
  • 1688做网站需要多少钱游戏开发巨头
  • 如何建立游戏网站wordpress后台菜单管理
  • 西宁网站维护公司深圳优化怎么做搜索
  • 东莞市建设企业网站服务机构十大经典案例
  • 深圳住房和建设局网站微九州合作网站