当前位置: 首页 > news >正文

厦门无忧网站建设有限公司wordpress 文章的各种调用

厦门无忧网站建设有限公司,wordpress 文章的各种调用,网站建设公司-跨界鱼科技,海外网站建设公司在此之前#xff0c;我们已成功利用Docker与Ollama框架#xff0c;在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。 准备vLLM镜像 在一台具备网络环境的机器上执行以下命令#xff0c;拉取vLLM的镜像#xff1a; # 官方镜像 docke…在此之前我们已成功利用Docker与Ollama框架在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。 准备vLLM镜像 在一台具备网络环境的机器上执行以下命令拉取vLLM的镜像 # 官方镜像 docker pull vllm/vllm-openai:latest# 如果因为墙的原因以上命令拉取不到可以去看看下面这些仓库 Docker仓库https://docker.1panel.live ✅网友自建 Docker仓库https://docker.agsv.top  ✅网友自建 Docker仓库https://docker.agsvpt.work  ✅网友自建 Docker仓库https://dockerpull.com ✅网友自建 Docker仓库https://dockerproxy.cn ✅网友自建 下载Qwen2-7B-Instruct模型 我这里下载的是Qwen2-7B-Instruct-GPTQ-Int4的模型。下载地址 https://huggingface.co/Qwen/Qwen2-7B-Instruct-GPTQ-Int4 编写Dockerfile 我们将Qwen2模型打包上传到服务器然后编写Dockerfile # 基础镜像 FROM vllm/vllm-openai:latest# 暴露端口 EXPOSE 8000# 将模型上传到基础镜像 ADD Qwen2-7B-Instruct-GPTQ-Int4 /home/Qwen2-7B-Instruct-GPTQ-Int4# 容器启动要执行的命令注意这里一定要是python3 ENTRYPOINT [python3,-m,vllm.entrypoints.openai.api_server,--served-model-name,Qwen2-7B-Instruct-GPTQ,--model,/home/Qwen2-7B-Instruct-GPTQ-Int4] 构建镜像 执行docker build命令构建docker镜像 docker build -t vllm_qwen2_7b:1.0 -f Dockerfile . 启动容器 执行以下命令启动docker容器 docker run -itd --runtime nvidia --gpus all --name vllm_qwen2 --env HUGGING_FACE_HUB_TOKENsecret -p 8000:8000 vllm_qwen2_7b:1.0 --max-model-len 8129 经过启动、测试模型运行没问题。 然后我们就可以将镜像导出提供给内网环境使用了 # 镜像导出 docker save -o vllm_qwen2.tar vllm_qwen2_7b:1.0 # 镜像导入 docker load -i vllm_qwen2.tar 问题解决 问题1、No CUDA GPUs are available 解决方法 1检查是否正确安装了CUDA驱动执行nvidia-smi可查看。 2docker run命令中没有添加--runtime nvidia --gpus all。 问题2unknown or invalid runtime name: nvidia 解决方法 当Docker容器需要使用GPU时需要配置Docker的default-runtime为nvidia然后重启Docker。 {runtimes:{ nvidia:{ path:nvidia-container-runtime, runtimeArgs:[] } }, default-runtime:nvidia } 如果是Windows版Docker需要在Docker Desktop中点击右上角的Setting然后点击Docker Engine在这里设置完上述配置后点击restart。 问题3、Try increasing gpu_memory_utilization or decreasing max_model_len when initializing the engine. 解决方法 因为GPU内存限制而需要调整模型的最大序列长度。在docker run命令最后加--max-model-len限制。 --max-model-len 8129
http://www.dnsts.com.cn/news/10723.html

相关文章:

  • 地方志网站群建设有什么要求
  • 做网站广州手机网站 代码
  • 汕头高端网站开发影视软件开发定制
  • 那个网站做的调查准确wordpress内存缓存无插件
  • 求一个全部用div做的网站编程怎样自学
  • 汝州网站建设wordpress分类显示图片
  • 遂宁网站建设公司论坛网站备案流程图
  • iis配置网站是什么wordpress上传html文件上传
  • 水富县建设局网站软件定制开发服务税率
  • 做旅游网站推广公司企业网站源码
  • uniform wordpress南山网站seo
  • 做调查问卷能挣钱的网站赶集网网站建设ppt模板
  • 网站开发工程师需要具备的综合素质网页制作工具可分为
  • 广东省建设监理协会网站官网上海工程公司
  • 搭建企业网站具体过程怎么做能上谷歌网站
  • 做网站制作浙江省建设信息
  • 做产品表情的网站热门网页游戏排行
  • php做网站 价格好的手机端网站模板下载软件
  • 网站建设依据在自己电脑上做网站
  • 肇庆制作网站软件网站建设7个基本流程
  • 阳泉推广型网站开发山东坤泰建设集团网站
  • 淘客网站如果做优化深圳十大活动策划公司
  • 宿松网站建设百度移动端点赞排名软件
  • 网站域名怎么修改最近几年做电影网站怎么样
  • 安徽省住房建设部官方网站迁西网站定制
  • 网站关联页面如何做网站建设策划书色彩设计方案
  • 专业的学校网站建设第一章 网站建设基本概述
  • 首页网站关键词优化教程如何做好网站搜索引擎优化
  • 公司想做个网站是in the wordpress
  • 江西中企动力做的网站wordpress登陆后台