当前位置: 首页 > news >正文

企业网站制作与维护wordpress中设置方法

企业网站制作与维护,wordpress中设置方法,做投资类网站服务器,网站开发的方式前言 InstructBlip可以理解为Blip2的升级版#xff0c;重点加强了图文对话的能力。 模型结构和Blip2没差别#xff0c;主要在数据集收集、数据集配比、指令微调等方面下文章。 创新点 数据集收集#xff1a; 将26个公开数据集转换为指令微调格式#xff0c;并将它们归类…前言 InstructBlip可以理解为Blip2的升级版重点加强了图文对话的能力。 模型结构和Blip2没差别主要在数据集收集、数据集配比、指令微调等方面下文章。 创新点 数据集收集 将26个公开数据集转换为指令微调格式并将它们归类到11个任务类别中。使用了其中13个数据集来进行指令微调另外13个数据集用于zero-shot评估。数据集配比提出了一种平衡采样策略以同步不同数据集间的学习进度。模型改进提出了指令感知的视觉特征提取能够根据输入文本提取特定的图像特征。说白了就是文本不仅输入到LLM也输入到Q-FormerQ-Former的输出再又给到LLM。评估并开源了一系列InstructBLIP模型使用了两类大型语言模型1) FlanT5一种基于T5 微调得到的encoder-decoder模型2) Vicuna一种基于LLaMA微调得到的decoder模型。InstructBLIP模型在广泛的视觉-语言任务上实现了最先进的零样本性能。 具体细节 数据集收集 总共收集了11个任务类别例如image captioning、visual reasoning等26个数据集如下 数据集需要转化为图文指令微调的形式用于多模态大语言模型的训练。 举个例子在image classification任务中图片A的类别是狗数据的组织形式要转换成 问题图片A请问图片的类别是什么 回答类别是狗 针对不同的任务类型有多样化模板来进行数据的形式转换如下 训练测试数据划分 26个数据集中13个用于训练另外13个用于测试 按照对zero-shot影响深浅评测集分为两类 训练集有同一任务的其他数据集训练集无同一任务的其他数据集 数据集配比 因数据集较多直接均匀分布可能会导致模型对小数据集过拟合而对大数据集欠拟合。 为了解决这个问题提出了一种采样策略即按照数据集大小或训练样本数的平方根成比例的概率来选择数据集。 给定D个数据集其大小分别为{S1, S2, …, SD}从数据集d中选取一个训练样本的概率 模型优化 从模型结构上看和Blip2一模一样。。。 Instruction指用户的问题有两个输入位置 Q-Former上一篇博客说到左列输入图像右列输入文本Instruction提取的是多模态特征相较于Blip2仅输入图像效果肯定是更好的LLMQ-Former的输出、Instruction在embedding层面融合输入到LLM中 class BertEmbeddings(nn.Module):Construct the embeddings from word and position embeddings.def __init__(self, config):super().__init__()self.word_embeddings nn.Embedding(config.vocab_size, config.hidden_size, padding_idxconfig.pad_token_id)self.position_embeddings nn.Embedding(config.max_position_embeddings, config.hidden_size)# self.LayerNorm is not snake-cased to stick with TensorFlow model variable name and be able to load# any TensorFlow checkpoint fileself.LayerNorm nn.LayerNorm(config.hidden_size, epsconfig.layer_norm_eps)self.dropout nn.Dropout(config.hidden_dropout_prob)# position_ids (1, len position emb) is contiguous in memory and exported when serializedself.register_buffer(position_ids, torch.arange(config.max_position_embeddings).expand((1, -1)))self.position_embedding_type getattr(config, position_embedding_type, absolute)self.config configdef forward(self,input_idsNone,position_idsNone,query_embedsNone,past_key_values_length0,):if input_ids is not None:seq_length input_ids.size()[1]else:seq_length 0if position_ids is None:position_ids self.position_ids[:, past_key_values_length : seq_length past_key_values_length].clone()if input_ids is not None:embeddings self.word_embeddings(input_ids)if self.position_embedding_type absolute:position_embeddings self.position_embeddings(position_ids)embeddings embeddings position_embeddingsif query_embeds is not None:embeddings torch.cat((query_embeds, embeddings), dim1)else:embeddings query_embedsembeddings self.LayerNorm(embeddings)embeddings self.dropout(embeddings)return embeddings可以看到 if query_embeds is not None:embeddings torch.cat((query_embeds, embeddings), dim1)作者重写了bert embedding层的代码将query_embeds可理解为Q-Former的输出和embeddings可理解为Instruction的文本embedding concat起来 推理策略 对于不同的任务类别采用不同的推理策略 对于绝大部分任务例如image captioning以及开放域VQA任务采用传统的transformer解码方式生成回答对于classification或multi-choice VQA这种回复内容受限的任务生成时限制解码的词表保证回复范围不超过规定范围。例如多选任务里回答只能约束在A B C D四个选项 实验结果 zero-shot对比 从图标上看效果确实比Blip2flamingo要好。不过InstructBlip在Blip2的基础上加了这么多数据训练效果没道理差。 消融实验 不把instruction送到Q-Former效果确实差了很多 同时不做数据配比效果也差了一些 指令微调 VS 多任务学习 指令微调在实现的时候利用了13个数据集来训练。一个比较类似的算法是多任务学习也能够实现多个数据集的学习。 为比较效果做了如下多任务学习实验 训练用原任务input-output数据测试用InstructBlip指令训练在input前添加数据集名称测试用InstructBlip指令训练在input前添加数据集名称测试在input前添加数据集名称 有两个观察多任务学习和InstructBlip在held-in 数据集上效果差不多。held-in数据可以理解为训练和测试均来自同一数据集说明InstructBlip在held-out数据集上远优于多任务学习held-out数据集指模型在训练时没见过这个数据集直接跨数据集。 笔者会持续关注多模态大语言模型MLLM对底层原理、经典论文、开源代码都会进行详细解读欢迎交流学习。
http://www.dnsts.com.cn/news/94174.html

相关文章:

  • 网站建设需要个体营业执照网站开发的毕设开题报告
  • 成都网站建设哪家好文章投资者关系互动平台
  • 网站转移码广点通投放平台登录
  • 做二手车网站需要什么手续大连网站开发招聘
  • 安徽建设监理协会网站网站后台修改不了
  • wordpress制作翻译莞城短视频seo优化
  • 电子商务网站建设的意义微信分销网站建设价格
  • 传统企业建设网站的内容小程序接入小商店
  • 大连网站建设动态郴州网站建设公司电话
  • 电子商务网站和开发新闻类网站Godaddy如何建设网站
  • 网站空白模板下载手机网站转微信小程序
  • 网站建设功能图网站开发用哪些技术
  • 企业网站源码htmlwordpress项目下载
  • 我国档案网站建设wordpress帐号导入
  • 外贸网站建设厦门容桂网站制作价位
  • 网站建设 佛山市网站优化排名怎么做
  • 域名和网站不是一家怎么办郑州官方网
  • 抖音 运营关键词搜索引擎优化推广
  • 厦门建设局网站首页6晋江网站建设
  • 东莞互联网营销网站建设贵州西能电力建设有限公司网站
  • 天津西青建设工程网站网站自己怎么做
  • 网站怎么开发wordpress的第三方登录插件
  • 做外贸的数据网站有哪些广州番禺房价2022年最新房价
  • 电子商务网站建设的答案wordpress 4.6 中文版
  • app开发和网站开发哪个简单免费ppt模板大全免费下载
  • 网站推广运作怎么做网页设计学校官网
  • 泰州网站建设优化ppt模板大全百度云
  • 做网站如何兼职网站建设佛
  • 网络网站推广优化用html做网站搜索框
  • 查看网站历史页面wordpress怎么建栏目