当前位置: 首页 > news >正文

购物网站二级页面模板长春做网站企业

购物网站二级页面模板,长春做网站企业,英文网站流量统计,成都做网站#x1f4dd;个人主页#x1f339;#xff1a;Eternity._ #x1f339;#x1f339;期待您的关注 #x1f339;#x1f339; ❀ 分割万物-SAM 介绍原理分割任务任务预训练zero-shot transfer相关任务 模型Image EncoderPrompt EncoderMask Eecoder消除歧义高效Loss 和训… 个人主页Eternity._ 期待您的关注 ❀ 分割万物-SAM 介绍原理分割任务任务预训练zero-shot transfer相关任务 模型Image EncoderPrompt EncoderMask Eecoder消除歧义高效Loss 和训练细节 推理与部署读取图片选择模型加载模型prompt推理WebUI 介绍 Segment Anything(SAM)是 Meta/FAIR 提出的以 data-centric AI 理念搭建的机器视觉分割模型堪称图像分割领域的 GPTSAM 在 1100w 张图片上镜像训练拥有分割万物的能力。无论是庞然大物、还是精细入微都可以准确区分。 可以点击此处体验模型demo。 论文地址见此。 原理 分割任务 任务 任务Task是由 NLP 领域带来的灵感。在 NLP 中通过预测 next token 作为预训练的任务在下游任务中使用 prompt engineering 作为应用。出于图像分割的需要SAM 将prompt 分为以下几种类型 pointboxmask文本 本文所涉及的所有资源的获取方式这里 预训练 可提示的分割任务提出一种自然的预训练算法模拟多种 sequence 的 prompt并且每一次训练都与 ground truth 进行比较。 zero-shot transfer 预训练任务赋予了模型在推理时对任何提示做出适当反应的能力因此下游任务可以通过设计合适的提示来解决。例如在实例分割中可以提供一个检测得到的 box SAN 就可以利用该 promp 进行实例分割。 相关任务 分割可以细分出很多领域交互式分割、边缘检测、超像素化、目标提案生成、前景分割、语义分割、实例分割、全景分割等。而SAM时一个具有广泛适用性的模型通过 prompt 可以适应许多现有的和新的分割任务。 模型 上图展示了 SAM 的结构。SAM 由以下三个部分组成。 Image Encoder 使用 MAE 预训练 ViT 模型处理高解析输入。Image Encoder 对每张图像运行并用于提示模型。 Prompt Encoder 模型设计了两种 prompt稀疏pointsboxestext、密集masks。点和框使用位置编码表示与每种 prompt 的 learned embedding 相加。而文本使用来自 CLIP 的现成文本 encoder。密集型提示使用卷积进行 embedded 与图像 embedding 相加。 Mask Eecoder 该部分有效地将 image embedding、 prompt embedding、 和输出 token 映射到一个 mask 上。修改 transformer decoder 块将 image embedding 和prompt embedding 做双向的 cross-attention。 消除歧义 只有一个输出的情况下如果给了一个模棱两可的提示模型会对多个有效的 mask 进行平均处理。为了解决这个问题模型被修改为对单个提示预测多个输出。而且可以发现三个输出就可以解决大多数常见情况。 高效 模型设计得非常高效在 web 浏览器上 CPU 计算只需要约 50 ms。、 Loss 和训练细节 主要使用 focal loss 和 dice loss。对于每个 mask 模型会随机产生 11 种 prompt 进行配对。 推理与部署 大部分可以使用的推理场景在文件中的 notebook 中打开后可以根据自己的需要运行任何一个部分。 此处介绍模型的推理方法。 首先确保安装对应的依赖 pip install githttps://github.com/facebookresearch/segment-anything.git pip install opencv-python pycocotools matplotlib onnxruntime onnx gradio读取图片 需要使用 opencv 读取图片使用以下代码读取一张图像 import cv2 image cv2.imread(imgs/example.jpg)选择模型 SAM有三种模型可以选择分别为sam_vit_l_0b3195、sam_vit_b_01ec64、sam_vit_h_4b8939。规模、效果以及需要的算力依次增加。 sam_checkpoint checkpoint/sam_vit_h_4b8939.pth model_type vit_hdevice cuda加载模型 使用sam_model_registry 加载指定的模型并得到预测器。将图片作为预测器的输入即可。 from segment_anything import sam_model_registry, SamPredictor sam sam_model_registry[model_type](checkpointsam_checkpoint) sam.to(devicedevice)predictor SamPredictor(sam)predictor.set_image(image)prompt SAM 可以接受多种形式的prompt。例如多个点和一个方框。同时也需要提供对应的标签。 import numpy as np input_point np.array([[300, 300], [350, 350]]) input_label np.array([1, 1]) input_box np.array([150, 100, 320, 500])推理 推理只需要使用预测器的 predict 函数该函数接受多个点输入最多一个方框的输入与对应的标签。multimask_output 表示是否输出多个预测。masks 即为模型的预测结果。 masks, _, _ predictor.predict(point_coordsinput_point,point_labelsinput_label,boxinput_box[None, :],multimask_outputFalse, )WebUI 为了方便大家操作制作了一个可以输入提示的网站。使用python webui.py即可启动网站。 在 Point 一栏输入点的横纵坐标SAM 就可以去识别点所标记的物体。支持多个点输入例如(100,150)(250,300)就输入 “100 150 250 300” 即可。点击右侧的 Add 将点添加进 prompt 中。点击 Preview 可以预览点所在的位置。没有任何输入时点击预览可以查看图片的坐标轴。点击底部的 Run 即可根据输入的 prompt 分割图像分给结果展示在下方。 在 Box 一栏输入方框左上角的横纵坐标与右下角的横纵坐标。方框(100,100,200,200)和(300,300,500,500)就输入为100 100 200 200 300 300 500 500 点击右侧的 Add 将方框添加进 prompt 中。点击 Run 运行现在不支持点和方框的混合输出。 编程未来从这里启航解锁无限创意让每一行代码都成为你通往成功的阶梯帮助更多人欣赏与学习 更多内容详见这里
http://www.dnsts.com.cn/news/255997.html

相关文章:

  • 合肥工程建设网站wordpress 怎么启动
  • 专业的做网站的都哪些网站可以做gif
  • 百度网站介绍显示图片南京市的网站是由那几家公司做的
  • php响应式个人博客网站设计被网上教开网店的骗了怎么办
  • 素材网站模板汽车网站开发方案
  • 生道网站建设平台网站后台如何添加视频
  • 网站开发的在淘宝上是什么类目潜江招聘资讯网
  • 做盗版电影网站后果4G访问wordpress
  • 网站建设行业如何网站正在建设中 模板
  • 陕西省建设厅网站官网江西省水文监测中心
  • 做的网站怎么查看点击率低代码开发技术
  • 做鼻翼整形整形的网站买虚机送网站建设
  • 网站开发开题报告pptwordpress网站公告
  • 免费crm软件东莞seo优化联系电话
  • 嘉兴市建设街道网站网站内容管理系统cms
  • 网站开发后台wordpress无法设置中文字体
  • 河源哪有做网站阳区城市规划建设局网站
  • 保健品企业网站娶妻为什么不娶外贸女
  • 网站优化大计软件开发要什么学历
  • 企业网站建设合同网站首页设计思路
  • 绍兴公司网站建设品牌形象设计方案
  • 网站设计师简介发软文
  • wordpress 招聘网站模板网上怎么找人去推广广告
  • 网站排队队列怎么做进博会上海2022
  • WordPress主题(模板)制作教程白城整站优化
  • 程序员做个网站要多少钱呢淘宝关键词排名怎么查询
  • 东莞建设工程造价管理网站做我的世界壁纸网站
  • 社交网站用户体验怎么建设电影网站
  • 天津网络网站公司小程序页面设计报价
  • 网站如何做促销活动餐饮设计公司