当前位置: 首页 > news >正文

企业诚信建设网站高端网站建设公司怎么选

企业诚信建设网站,高端网站建设公司怎么选,医疗网站建设好么,企业所得税优惠政策最新2023一般纳税人本节主要介绍NLP和大模型的基础知识。提及了词表示如何从one-hot发展到Word Embedding。语言模型如何从N-gram发展成预训练语言模型PLMs。然后介绍了大模型在NLP任务上的表现#xff0c;以及它遵循的基本范式。最后介绍了本课程需要用到的编程环境和GPU服务器。 一篇NLP方向的…本节主要介绍NLP和大模型的基础知识。提及了词表示如何从one-hot发展到Word Embedding。语言模型如何从N-gram发展成预训练语言模型PLMs。然后介绍了大模型在NLP任务上的表现以及它遵循的基本范式。最后介绍了本课程需要用到的编程环境和GPU服务器。 一篇NLP方向的综述推荐 Advances in Natural Language Processing - Julia Hirschberg,Columbia University(见绑定资源) 基本任务和应用 包括词性标注(Part of speech tagging)命名实体识别共指消解依赖关系。对于中文由于词与词没有空格所以还有一个中文的自动分词的任务。 搜索引擎和广告如何衡量用户的query与所有document的语义相似度-NLP要解决的问题利用互联网之间的链接信息判断网站或网页的质量-数据挖掘和信息检索关心的问题Knowledge Graph知识图谱里有非常多NLP问题如给定一个用户的查询如何去匹配或寻找最相关的实体以及相关知识。如何从大规模文本中挖掘构建大的知识图谱如何获取三元组结构化知识本身也需要NLP技术。Knowledge Graph ApplicationQuestion AnsweringMachine Reading从文本中抽取结构知识扩展和更新知识图谱Personal AssistantMachine TranslationSentiment Analysis and Opinion MiningComputational Social Science 词表示 词表示的目标 1.计算词相似性相似 2.推断词之间的关系 常用的词表示方式one-hot表示 这种表示方法的缺点是任意两个词都是相互正交的。不利于考虑相似性。 基于共现词次数的表示 NLP提出了一种contextual的distribution。 这种表示方法的缺点是词表越大存储要求越高低频词很稀疏导致不够鲁棒。 Word Embedding 构建一个低维稠密向量空间学习每个词的低维稠密向量表示。 语言模型Language Modeling 语言模型的任务是预测下一个词。 它的工作包括两个1.一个序列的词成为一句话的概率2.根据已有的词序列预测下一个词出现的概率。 基本假设 未来的词只会收到之前词的影响。这样联合概率就可以拆解成如下的条件概率。 N-gram Model 先介绍一种在深度学习出现前经典且重要的语言模型构建方式N-gram。 以4-gram为例讨论never to late to后面出现wj的概率可以用语料库中too late to wj出现的次数除以too late to出现的次数。 需要统计所有出现的n-gram序列的频度。 N-gram的问题是 1.N一般只会取2或者3因为取过大的N序列在语料库中出现的次数会变少会导致统计结果稀疏。同时过大的N会导致存储的量增大。 2.不能反映词之间的相似性N-gram是基于符号去做统计所以对它而言所有词都是独立的。 神经语言模型 神经语言模型是基于神经网络来学习词的分布式表示的语言模型。 假设当前要预测第t个词为词i的概率考虑前面n个词 1.将前面n个词表示成低维向量(从Word Embedding学到的低维稠密向量空间中找到)。 2.拼接上面的低维向量形成更高的上下文向量。 3.经过非线性转换。 4.利用这个向量来预测下一个词是什么。 所有词的向量以及整个预测的过程都是基于神经网络的可调节可学习参数来完成。因此可以利用大规模数据来学习这些向量。 大模型的发展历程 为什么大模型非常重要 在语言理解语言生成(如对话系统任务)上预训练语言模型(PLMs)已经比人类表现要好了。 18年开始PLMs的三个趋势是更多的参数更大规模的语料数据更大规模的分布式计算。这些方式能显著提升模型性能。 GPT-3中我们可以看到PLMs所涌现出来的人类知识。这说明文本知识会被捕捉到PLMs中并且在大量参数中存储下来。所以渐渐地大家会将PLMs作为解决NLP问题的基础工具。 另一方面GPT-3有很强的零/小样本学习的能力。 大模型背后的范式 预训练阶段PLMs会从大量无标注数据中进行学习通过一些自监督任务去做预训练从中得到丰富的知识。 在具体应用时候会引入一些任务相关数据然后对模型进行微调。 最终保留任务相关的知识。最终得到一个解决具体任务的模型。 编程环境和GPU服务器介绍 相关知识如Linux命令Git命令等需要自己了解。
http://www.dnsts.com.cn/news/185262.html

相关文章:

  • 大连市建设工程老网站网站开发四点注意事项
  • html5导航网站源码下载移动端网站欣赏
  • 企业网站建设售后服务内容盐山联通大厦 网站建设
  • 网站中文域名到期有没有影响一级消防工程师考试报名
  • 4徐汇区网站建设制作钓鱼网站属于什么罪
  • app软件下载站seo教程wordpress怎么调用文章列表
  • 2019还有人做网站淘宝客吗做旅游销售网站平台ppt
  • 做网站需要注意的问题减肥单页网站
  • 建站平台 phpwind苏州手机app开发
  • 万先生网站如何做个网站推广自己产品
  • 做网站的cnfg装饰公司管理系统
  • 51网站怎么打开wordpress文章付费阅读设置
  • 手机网站解析地址江苏省建筑网站
  • 中煤建设集团网站wordpress支付下载插件
  • 什么网站流量多物流网站推广怎么做
  • 微信小程序制作免费轻站平台wordpress页面原文件下载
  • 企业网站开发基本流程广州网站设计我选刻
  • 装饰公司怎样做网站美丽中国网页界面设计
  • 网站建设平台还有没有趋势网站推广策略有哪些
  • 网站开发与设计前景注册公司取名字
  • 东莞网站制作公司联系方式做优惠卷网站倒闭了多少
  • 福建市建设厅网站站长工具收录
  • 深圳好的网站制作公司wordpress商城 微信支付
  • 深圳做网站排名哪家好唯美音乐图文网站建设
  • 微信网站开发登录蓝色风格的网站
  • php购物网站开发设计与实现wordpress引用轮播图文件
  • 购物网站如何推广seo关键词怎么选择
  • 七彩建设发展有限公司官方网站大型网站 jquery
  • 建站行业都扁平化设计网站建设中最重要的是什么
  • 最好的开发网站建设flash 网站设计