当前位置: 首页 > news >正文

wordpress建站seo永久免费wap自助建站

wordpress建站seo,永久免费wap自助建站,关于网站建设 策划文案,百度网盘网页前言 对比学习损失#xff08;Contrastive Learning Loss#xff09;是一种用于自监督学习的损失函数。它侧重于学习一个特征空间#xff0c;其中相似的样本被拉近#xff0c;而不相似的样本被推远。在二分类任务中#xff0c;对比学习损失可以用来学习区分正负样本的特征… 前言       对比学习损失Contrastive Learning Loss是一种用于自监督学习的损失函数。它侧重于学习一个特征空间其中相似的样本被拉近而不相似的样本被推远。在二分类任务中对比学习损失可以用来学习区分正负样本的特征表示。 对比学习损失函数有多种其中比较常用的一种是InfoNCE loss。 InfoNCE Loss损失函数是基于对比度的一个损失函数是由NCE Loss损失函数演变而来。 1.Alignment和Uniformity  1.1 Alignment Alignment和Uniformity都是对比学习的表示能力的评判标准。出自论文《Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere》。 Alignment指的是相似的例子也就是正例映射到单位超球面后应该具有比较接近的特征球面距离应该比较近 1.2 Uniformity  Uniformity指的是系统应该倾向于应该在特征里保留尽可能多的信息映射到球面上就要求单位球面上的特征应该尽可能地均与分布在球面上分布越均匀意味着保留的特征也就越多越充分。因为分布越均匀意味着各自保留各自的独有的特征这代表着信息保留越充分。 Uniformity特性的极端反例所有数据都映射到单位超球面的同一个点上这代表着所有数据的信息都被丢掉体现为数据分布极度不均匀得到了超球面上的同一个点。也就意味着所有数据经过两次非线性计算之后都收敛到同一个常数上这种异常情况我们称之为模型坍塌collapse 2.对比学习的损失函数 模型作决策时假设输入到 softmax 前的结果用 sθ(w,c) 表示实际上 sθ(w,c) 是有含义的它是一个 socring function 输出的分数用来量化  w 在上下文 c 中匹配性那么 w 条件概率可以表示为以下形式  其中分母部分是归一化常数一个目的是用来让这个分布真的成为一个“分布”要求分布积分1很多时候比如计算一个巨大几十上百万词的词表在每一个词上的概率得分的时候计算这个分母会变得非常非常非常消耗资源。 所以在一些应用比如一个语言模型最后softmax层中在推理阶段其实只要找到的那一项就够了并不需要归一化当然这个操作其实是错误的。正确的推理是计算出每一个词的概率作为分布然后从这个分布中采样得到一个正确的词而不是直接挑一个分数最大的。但是一切为了运算方便。但在模型的训练阶段由于分母Z中是包含了模型参数的所以也要一起参与优化所以这个计算省不了当然softmax这个函数比较特殊在实际应用中也相当于没有计算这个归一化项只是计算了ground-truth word的那一项。  2.1.NCE Loss  NCENoise contrastive estimation 它是通过最大化同一个目标函数来估计模型参数 θ 和归一化常数NCE 的核心思想就是通过学习数据分布样本和噪声分布样本之间的区别从而发现数据中的一些特性因为这个方法需要依靠与噪声数据进行对比所以称为“噪声对比估计Noise Contrastive Estimation” NCENoise contrastive estimation 核心思想是将多分类问题转化成二分类问题。分类器能够对数据样本和噪声样本进行二分类一个类是数据类别 data sample另一个类是噪声类别 noisy sample通过学习数据样本和噪声样本之间的区别将数据样本去和噪声样本做对比也就是“噪声对比noise contrastive”从而发现数据中的一些特性。 但是如果把整个数据集剩下的数据都当作负样本即噪声样本虽然解决了类别多的问题计算复杂度还是没有降下来解决办法就是做负样本采样来计算loss这就是estimation的含义也就是说它只是估计和近似。一般来说负样本选取的越多就越接近整个数据集效果自然会更好。  结论是对于设置的噪声分布  我们实际上是希望它尽量接近数据分布否则这个二分类任务就过于简单了也就无法很好的学到数据特性。而作者通过实验和推导证明我在第三节中也会简单的证明当负样本和正样本数量之比 k 越大那么我们的 NCE 对于噪声分布好坏的依赖程度也就越小。换句话说作者建议我们在计算能力运行的条件下尽可能的增大比值 k 。也许这也就是大家都默认将正样本数量设置为 1 的原因正样本至少取要 1 个所以最大化比值  k 也就是尽可能取更多负样本的同时将正样本数量取最小值 1。 另外如果我们希望目标函数不是只针对一个特定的上下文 c 而是使不同的上下文可以共享参数至此 NCE 的构建就完成了。 总结一下就是从上下文 c 中取出单词作为正样本从噪声分布中取出单词作为负样本正负样本数量比为 1:k 然后训练一个二分类器通过一个类似于交叉熵损失函数的目标函数进行训练。 2.2 InfoNEC Loss Info NCE loss是NCE的一个简单变体它认为如果你只把问题看作是一个二分类只有数据样本和噪声样本的话可能对模型学习不友好因为很多噪声样本可能本就不是一个类因此还是把它看成一个多分类问题比较合理公式如下 其中是第i个样本的特征表示 是其正样本 是负样本是样本x 和y 之间的相似性度量例如余弦相似性 τ 是一个温度参数用于控制损失函数的形状。 在公式中可知分子体现出了Alignment属性它期望在超球面上正例之间的距离越近越好分母则体现了Uniformity属性它期望在负例对之间的距离尽可能的远这种推力会尽量将点尽可能地均匀分布在超球面上保留了尽可能多的有用信息。分子部分表示正例之间的相似度分母表示正例与负例之间的相似度因此相同类别相似度越大不同类别相似度越小损失就会越小。 损失函数inforNCE会在Alignment和Uniformity之间寻找折中点。如果只有Alignment模型会很快坍塌到常数损失函数中采用负例的对比学习计算方法主要是靠负例的Uniformity来防止模型坍塌很多典型的对比学习方法都是基于此的。infoNCE的思想就是正例之间相互吸引负例之间相互排斥。 温度系数是设定的超参数它的作用是控制模型对负样本的区分度。温度参数会将模型更新的重点聚焦到有难度的负例并对他们做相应的惩罚难度越大也即与正例越接近分配到的惩罚系数越多。在模型优化的过程中需要将这些负例从正例旁边推开使得其距离越远是一种斥力。也就是距离越近的负例会获得更多的权重会具有更大的斥力需要将其推开的力越大。 温度系数设的越大sim的分布变得越平滑那么对比损失会对所有的负样本一视同仁导致模型学习没有轻重。 如果温度超参数设置过小会导致损失函数分配的惩罚项范围越窄更加聚焦在比较近的范围之内负例之中。同时如果这些被覆盖的负例因为数量减少了会导致分配到的每个负例上的权重更大斥力会更大。会导致模型会越关注特别困难的负样本但其实那些负样本很可能是潜在的正样本这样会导致模型很难收敛或者泛化能力差。因此温度系数的设定是不可或缺的。 一般情况下有效的负例只会聚焦在距离最近的一到两个最难的实例。我们希望能够在温度参数能够在alginment和unifoemity之间找一个平衡点。温度系数在处在一个平衡点时超球面上的密集数据才会被打散数据将会越来越均匀。 3.交叉熵损失函数 交叉熵损失函数的形式如图所示 softmax公式如下所示 在分类中由于输出是是one-hot向量只有一个维度为1其他维度都为0的向量所以交叉熵损失函数如下所示 这和InfoNCE Loss的损失函数的形式十分相似不同在于上式中的k在有监督学习里指的是这个数据集一共有多少类别比如数据集中有1000类k就是1000。 而在InfoNCE loss中类别只有两类或者几类而交叉熵损失函数每一个用户或者商品自成一类softmax操作在如此多类别上进行计算是非常耗时的再加上有指数运算的操作这导致计算复杂度相当高且不能实现。 Reference:         1.Noise Contrastive Estimation 前世今生——从 NCE 到 InfoNCE - 知乎         2.求通俗易懂解释下nce loss - 知乎         3.https://blog.csdn.net/qq_46006468/article/details/126076039         4.对比学习损失 InfoNCE_contrastive loss 和infonce_UCAS_V的博客-CSDN博客
http://www.dnsts.com.cn/news/275771.html

相关文章:

  • 0元购怎么在网站做用ps怎么做短视频网站
  • 阿里巴巴国际站运营培训厂房网行业门户网站建设策划方案ppt
  • 怎么把网站开发成crx公司注册查重名
  • 扬中零壹网站建设淘宝上开网店的流程
  • 网站购买流程帮老板做网站
  • 狮岭做网站wordpress 页面调用标签
  • 什么网站做专利检索报告山西中交建设工程招标有限公司网站
  • 设计电子商务网站方式企业网站黄页怎么做
  • 网页网站建设的步骤流程做电商必备的八个软件
  • 贵州省住房和城乡建设厅网站-首页项目立项查询平台
  • 安阳企业网站优化排名找公司做网站需要买服务器
  • 幼教机构网站开发设计论文建设网站内容
  • 商务网站开发实训体会互联网最吃香的职业
  • 网站开发要学的代码dz网站模版
  • asp网站好还是php网站好沧州网站制作的流程
  • 布吉附近做网站广州天河区必去的地方
  • 响应式网站好处河南建设工程协会网站
  • 安庆城乡建设局网站seo百科
  • 镇江建设网站公司做网站品
  • 学校网站 网站建设wordpress动漫主题曲
  • 怎样制作公司网站在线代码编辑器
  • 做网站后台指的那二次开发客户
  • 网站关键词多长企业网站开发框架
  • 我想建网站做推广内网代理ip建设网站
  • 电商网站如何提高转化率手机兼职工作有哪些
  • 昆山网站建设义搏义乌开锁做网站哪个好
  • 在那里做网站勘察设计人才网
  • 淘宝放单网站怎么做网站修改标题
  • 局网站建设电商网站代码模板
  • 网站建设实训心得体会300字怎么下载Wordpress