当前位置：首页 > news >正文

厦门无忧网站建设有限公司wordpress 文章的各种调用

news 2025/9/22 1:37:23

厦门无忧网站建设有限公司,wordpress 文章的各种调用,网站建设公司-跨界鱼科技,海外网站建设公司在此之前#xff0c;我们已成功利用Docker与Ollama框架#xff0c;在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。准备vLLM镜像在一台具备网络环境的机器上执行以下命令#xff0c;拉取vLLM的镜像#xff1a; # 官方镜像 docke…在此之前我们已成功利用Docker与Ollama框架在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。准备vLLM镜像在一台具备网络环境的机器上执行以下命令拉取vLLM的镜像 # 官方镜像 docker pull vllm/vllm-openai:latest# 如果因为墙的原因以上命令拉取不到可以去看看下面这些仓库 Docker仓库https://docker.1panel.live ✅网友自建 Docker仓库https://docker.agsv.top ✅网友自建 Docker仓库https://docker.agsvpt.work ✅网友自建 Docker仓库https://dockerpull.com ✅网友自建 Docker仓库https://dockerproxy.cn ✅网友自建下载Qwen2-7B-Instruct模型我这里下载的是Qwen2-7B-Instruct-GPTQ-Int4的模型。下载地址 https://huggingface.co/Qwen/Qwen2-7B-Instruct-GPTQ-Int4 编写Dockerfile 我们将Qwen2模型打包上传到服务器然后编写Dockerfile # 基础镜像 FROM vllm/vllm-openai:latest# 暴露端口 EXPOSE 8000# 将模型上传到基础镜像 ADD Qwen2-7B-Instruct-GPTQ-Int4 /home/Qwen2-7B-Instruct-GPTQ-Int4# 容器启动要执行的命令注意这里一定要是python3 ENTRYPOINT [python3,-m,vllm.entrypoints.openai.api_server,--served-model-name,Qwen2-7B-Instruct-GPTQ,--model,/home/Qwen2-7B-Instruct-GPTQ-Int4] 构建镜像执行docker build命令构建docker镜像 docker build -t vllm_qwen2_7b:1.0 -f Dockerfile . 启动容器执行以下命令启动docker容器 docker run -itd --runtime nvidia --gpus all --name vllm_qwen2 --env HUGGING_FACE_HUB_TOKENsecret -p 8000:8000 vllm_qwen2_7b:1.0 --max-model-len 8129 经过启动、测试模型运行没问题。然后我们就可以将镜像导出提供给内网环境使用了 # 镜像导出 docker save -o vllm_qwen2.tar vllm_qwen2_7b:1.0 # 镜像导入 docker load -i vllm_qwen2.tar 问题解决问题1、No CUDA GPUs are available 解决方法 1检查是否正确安装了CUDA驱动执行nvidia-smi可查看。 2docker run命令中没有添加--runtime nvidia --gpus all。问题2unknown or invalid runtime name: nvidia 解决方法当Docker容器需要使用GPU时需要配置Docker的default-runtime为nvidia然后重启Docker。 {runtimes:{ nvidia:{ path:nvidia-container-runtime, runtimeArgs:[] } }, default-runtime:nvidia } 如果是Windows版Docker需要在Docker Desktop中点击右上角的Setting然后点击Docker Engine在这里设置完上述配置后点击restart。问题3、Try increasing gpu_memory_utilization or decreasing max_model_len when initializing the engine. 解决方法因为GPU内存限制而需要调整模型的最大序列长度。在docker run命令最后加--max-model-len限制。 --max-model-len 8129

http://www.dnsts.com.cn/news/10723.html

相关文章：

地方志网站群建设有什么要求

做网站广州手机网站代码

汕头高端网站开发影视软件开发定制

那个网站做的调查准确wordpress内存缓存无插件

求一个全部用div做的网站编程怎样自学

汝州网站建设wordpress分类显示图片

遂宁网站建设公司论坛网站备案流程图

iis配置网站是什么wordpress上传html文件上传

水富县建设局网站软件定制开发服务税率

做旅游网站推广公司企业网站源码

uniform wordpress南山网站seo

做调查问卷能挣钱的网站赶集网网站建设ppt模板

网站开发工程师需要具备的综合素质网页制作工具可分为

广东省建设监理协会网站官网上海工程公司

搭建企业网站具体过程怎么做能上谷歌网站

做网站制作浙江省建设信息

做产品表情的网站热门网页游戏排行

php做网站价格好的手机端网站模板下载软件

网站建设依据在自己电脑上做网站

肇庆制作网站软件网站建设7个基本流程

阳泉推广型网站开发山东坤泰建设集团网站

淘客网站如果做优化深圳十大活动策划公司

宿松网站建设百度移动端点赞排名软件

网站域名怎么修改最近几年做电影网站怎么样

安徽省住房建设部官方网站迁西网站定制

网站关联页面如何做网站建设策划书色彩设计方案

专业的学校网站建设第一章网站建设基本概述

首页网站关键词优化教程如何做好网站搜索引擎优化

公司想做个网站是in the wordpress

江西中企动力做的网站wordpress登陆后台