当前位置: 首页 > news >正文

很有风格的网站有哪些网页制作软件有那些

很有风格的网站有哪些,网页制作软件有那些,装修公司哪家好兰州的,化工行业网站设计#x1f3e1;作者主页#xff1a;点击#xff01; #x1f916;编程探索专栏#xff1a;点击#xff01; ⏰️创作时间#xff1a;2024年12月2日21点02分 神秘男子影, 秘而不宣藏。 泣意深不见, 男子自持重, 子夜独自沉。 论文链接 点击开启你的论文编程之旅h… 作者主页点击  编程探索专栏点击 ⏰️创作时间2024年12月2日21点02分 神秘男子影,   秘而不宣藏。 泣意深不见, 男子自持重,    子夜独自沉。 论文链接 点击开启你的论文编程之旅https://www.aspiringcode.com/content?id17320697597148uid01ec6d85f5984256b968a6976921794c 检测作为计算机视觉领域的一项重要任务旨在从图像中准确地识别并定位出感兴趣的目标。近年来随着深度学习技术的快速发展目标检测算法取得了显著的进展。本文将带您回顾目标检测技术的发展历程从早期的二阶段算法到YOLO系列再到如今的Grounding Dino。 二阶段目标检测算法 R-CNNRegions with CNN features R-CNN是第一个将深度学习应用于目标检测的算法于2014年由Girshick等人提出。R-CNN采用选择性搜索算法提取候选区域然后利用卷积神经网络CNN提取特征最后通过支持向量机SVM进行分类。 Fast R-CNN 为了解决R-CNN速度慢、重复计算的问题Girshick于2015年提出了Fast R-CNN。Fast R-CNN采用ROIRegion of InterestPooling层实现了候选区域的共享特征提取大大提高了检测速度。 Faster R-CNN 2015年Ren等人在Fast R-CNN的基础上提出了Faster R-CNN。Faster R-CNN引入了区域建议网络RPN实现了候选区域的端到端训练进一步提高了检测速度和准确性。 YOLO系列 YOLOYou Only Look Once模型是一种流行的实时目标检测算法它将目标检测任务视为一个单一的回归问题通过单个卷积神经网络CNN同时预测多个边界框和类别概率实现了端到端的快速检测极大地提高了检测速度同时保持了较高的准确性使其在视频监控、自动驾驶等实时应用场景中具有广泛的应用价值。 Grounding Dino Grounding Dino模型是一种创新的视觉目标检测方法它结合了自然语言处理和计算机视觉的技术通过使用Transformer架构来实现对图像中目标的定位和描述。 第一段模型架构 Grounding Dino模型的核心是一个基于Transformer的编码器-解码器结构。编码器用于提取图像的特征而解码器则负责将自然语言查询与图像特征进行匹配生成目标的定位信息。这种架构允许模型理解图像内容与文本描述之间的关联从而无需传统的边界框标注直接通过文本指令来定位图像中的目标。 第二段工作原理 在执行目标检测时Grounding Dino模型接收一个图像和一个相关的文本查询作为输入。模型首先使用编码器提取图像的深层特征然后解码器将这些特征与文本查询中的单词进行交互通过注意力机制找出与查询最相关的图像区域。最终模型输出一个定位热图指示查询文本所指目标在图像中的位置。 第三段优势与应用 Grounding Dino模型的优势在于其无需精确的边界框标注降低了数据准备的成本并且能够处理细粒度的目标检测任务。此外由于其基于文本的查询机制模型在处理复杂场景和具有描述性需求的应用中表现出色。这使得Grounding Dino在图像检索、交互式视觉问答系统等领域具有广泛的应用潜力。 演示效果 TEXT_PROMPT “chair . person . dog . cat .” TEXT_PROMPT “chair . person . dog . cat .” Grounding DINO Model Overall (总体架构) 输入 Input Text: 输入文本例如“cat . person . mouse .”或“A cat sets on a table.” Input Image: 输入图像。 Text and Image Backbone Networks (文本和图像主干网络) Text Backbone: 提取文本特征。 Image Backbone: 提取图像特征。 Feature Enhancer (特征增强器) 接收原始的文本特征和图像特征并对其进行增强处理。 Cross-Modality Decoder (跨模态解码器) Language-guide Query Selection: 根据语言信息选择查询。 Cross-Modality Queries: 生成跨模态查询。 Model Outputs (模型输出) 包括对比损失Contrastive loss和定位损失Localization loss。 Feature Enhancer (特征增强器) 功能模块 Text-to-image Cross-Attention: 利用文本特征对图像特征进行增强。 Image-to-text Cross-Attention: 利用图像特征对文本特征进行增强。 Self-Attention Mechanism: 对文本和图像特征进行自注意力处理。 Feed Forward Network (FFN): 对增强后的特征进行进一步处理。 流程 文本特征和图像特征分别经过各自的主干网络得到初步表示。 这些初步表示被送入特征增强器中。 特征增强器首先通过文本到图像的跨注意力机制增强图像特征然后通过图像到文本的跨注意力机制增强文本特征。 增强后的特征再经过自注意力机制进一步优化。 最后通过前馈神经网络FFN对特征进行最终处理。 A Decoder Layer (解码器层) 功能模块 Cross-Modality Attention: 更新跨模态查询。 Self-Attention Mechanism: 对文本和图像特征进行自注意力处理。 Feed Forward Network (FFN): 对处理后的特征进行进一步处理。 流程 跨模态查询通过跨模态注意力机制进行更新。 更新后的查询与文本和图像特征一起进入解码器层。 解码器层首先对文本和图像特征进行自注意力处理。 然后通过前馈神经网络FFN对特征进行进一步处理。 Grounding DINO使用代码 预测多个类别 from groundingdino.util.inference import load_model, load_image, predict, annotate import cv2model load_model(groundingdino/config/GroundingDINO_SwinT_OGC.py, groundingdino/weights/groundingdino_swint_ogc.pth) IMAGE_PATH .asset/cat_dog.jpeg TEXT_PROMPT chair . person . dog . cat . BOX_TRESHOLD 0.35 TEXT_TRESHOLD 0.25image_source, image load_image(IMAGE_PATH)boxes, logits, phrases predict(modelmodel,imageimage,captionTEXT_PROMPT,box_thresholdBOX_TRESHOLD,text_thresholdTEXT_TRESHOLD,devicecuda ) annotated_frame annotate(image_sourceimage_source, boxesboxes, logitslogits, phrasesphrases) cv2.imwrite(annotated_image.jpg, annotated_frame) 模型训练 将model.eval()改成model.train() 修改代码6768行 微调训练框架 from groundingdino.util.inference import load_model, load_image, predict, annotate import cv2 model load_model(groundingdino/config/GroundingDINO_SwinT_OGC.py, groundingdino/weights/groundingdino_swint_ogc.pth)for epoch in range(epoches):# 加载符合模型数据集标准的数据每一次输入是一个列表每一项是一个字典for data in train_dataloader: IMAGE_PATHdata[image_path]image_source, image load_image(IMAGE_PATH)boxes, logits, phrases predict(modelmodel,imageimage,captionTEXT_PROMPT,box_thresholdBOX_TRESHOLD,text_thresholdTEXT_TRESHOLD,devicecuda)lossloss_function(output,data[real_predict])optimiezer.zero_gard()loss.backward()optimiezer.step()模型部署 Grounding DINO权重下载 https://hf-mirror.com/ShilongLiu/GroundingDINO/tree/main 放入附件内容中 BERT权重下载 https://hf-mirror.com/google-bert/bert-base-uncased/tree/main 随便放入那个文件夹都行例如D:/bert-base-uncased 修改config文件 安装依赖配置 设置环境变量 然后进入附件中 pip install . 最后运行代码 python demo.py 成功的路上没有捷径只有不断的努力与坚持。如果你和我一样坚信努力会带来回报请关注我点个赞一起迎接更加美好的明天你的支持是我继续前行的动力 每一次创作都是一次学习的过程文章中若有不足之处还请大家多多包容。你的关注和点赞是对我最大的支持也欢迎大家提出宝贵的意见和建议让我不断进步。 神秘泣男子
http://www.dnsts.com.cn/news/67302.html

相关文章:

  • 自助建站系统搭建网站蒙特网公司做什么的
  • 关于数据库的网站开发上传设计作品的网站
  • 建筑公司网站电工网站建设视频教程
  • 建设通和天眼查网站网站建设图片轮播
  • 邢台精品网站建设建站管理后台
  • 网站系统分类网络营销案例图文ppt
  • 换友情链接的网站珠海易注册app下载
  • 旅游网站设计策划书页游排行榜前十名网络游戏
  • 文安网站建设如何将优酷视频上传到自己网站
  • 山东飞鸿建设集团网站wordpress安全设置方法
  • 网站充值 下模板顺的品牌网站建设
  • python做的网站如何部署智能软件开发专业
  • wordpress采集插件 免费下载东莞整站优化火速公司
  • 网站的域名和ip地址如何重新解析建设信用中国网站
  • 贵阳网站建设专家域名注册后网站建设
  • 怎么做网站的防盗链网站建设编程语言
  • 微信公众号商城怎么制作南京seo公司教程
  • 宝塔搭建wordpress网站学做网站前景
  • 网站网页策略wordpress动态二维码
  • 做企业商城网站要多少钱邯郸网站建设选哪家好
  • 广西建设学院网站房产信息查询平台
  • 网站推广有用吗?家纺 网站模版
  • 工布江达网站建设网站结构是什么 怎么做
  • 网站建设的要点中国电商平台有多少家
  • 河南怎么样做网站百度搜索风云榜电脑版
  • 做网站什么科目wordpress 安卓
  • 百度搜索引擎的原理seo顾问阿亮
  • 网站qq临时会话代码wordpress openid
  • 烟台建设银行网站企业建站费用情况
  • 国外空间怎么上传网站打电话做网站的话术