当前位置: 首页 > news >正文

如何提高网站速度微信推送用哪个网站做

如何提高网站速度,微信推送用哪个网站做,网站备案多长时间来完成,qq登录插件wordpress本篇文章记录下 chatglm-6B 训练和推理过程 环境#xff1a;Ubuntu 20.04 1.13.0cu116 chatglm-6B 源代码仓库#xff1a;链接 chatglm-6B 模型权重#xff1a;链接 源代码及模型 clone 到本地 这里使用的是 THUDM 在 hugging face 开源的模型。 因为模型比较大#xff…本篇文章记录下 chatglm-6B 训练和推理过程 环境Ubuntu 20.04 1.13.0cu116 chatglm-6B 源代码仓库链接 chatglm-6B 模型权重链接 源代码及模型 clone 到本地 这里使用的是 THUDM 在 hugging face 开源的模型。 因为模型比较大仓库保存模式使用的是 git lfs 模式再 clone 之后再使用 git lfs pull 去 download 大文件。 clone chatglm6B 代码 git clone https://github.com/THUDM/ChatGLM-6Bgit lfs 在 ubuntu 的安装方式。参考 curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash sudo apt-get install git-lfsclone 模型权重到本地并且使用 git lfs pull 最新版本的模型权重。参考 git lfs install git clone https://huggingface.co/THUDM/chatglm-6b git lfs pullchatglm-6B ptuning 训练 THUDM提供的 ptuning 方式 链接 链接 这里需要配置的执行脚本如下 # train.sh PRE_SEQ_LEN128 LR2e-2CUDA_VISIBLE_DEVICES0 python3 main.py \--do_train \ --train_file /data/AdvertiseGen/train.json \--validation_file /data/AdvertiseGen/dev.json \--prompt_column content \--response_column summary \--overwrite_cache \--model_name_or_path /data/chatglm-6b \--output_dir /data/chatglm-6b-output/adgen-chatglm-6b-pt-$PRE_SEQ_LEN-$LR \--overwrite_output_dir \--max_source_length 64 \--max_target_length 64 \--per_device_train_batch_size 1 \--per_device_eval_batch_size 1 \--gradient_accumulation_steps 16 \--predict_with_generate \--max_steps 100 \--logging_steps 10 \--save_steps 50 \--learning_rate $LR \--pre_seq_len $PRE_SEQ_LEN \--quantization_bit 4在显卡内存较低情况下可以使用 quantization_bit4、per_device_train_batch_size1、gradient_accumulation_steps16 这种配置下 INT4 的模型参数被冻结一次训练迭代会以 1 的批处理大小进行 16 次累加的前后向传播等效为 16 的总批处理大小此时最低只需 6.7G 显存。 训练输出的 metrics 如下 chatglm-6B 推理 推理阶段使用的是训练导出的 checkpoint 文件。对应好训练阶段 的 PRE_SEQ_LEN LR 以及训练 STEP 配置方式如下 # evaluate.sh PRE_SEQ_LEN128 CHECKPOINTadgen-chatglm-6b-pt-128-2e-2 STEP100CUDA_VISIBLE_DEVICES0 python3 main.py \--do_predict \--validation_file /data/AdvertiseGen/dev.json \--test_file /data/AdvertiseGen/dev.json \--overwrite_cache \--prompt_column content \--response_column summary \--model_name_or_path /data/chatglm-6b \--ptuning_checkpoint /data/chatglm-6b-output/$CHECKPOINT/checkpoint-$STEP \--output_dir /data/chatglm-6b-output/$CHECKPOINT \--overwrite_output_dir \--max_source_length 64 \--max_target_length 64 \--per_device_eval_batch_size 1 \--predict_with_generate \--pre_seq_len $PRE_SEQ_LEN \--quantization_bit 4运行结果 web_demo 执行 相关参考 1、https://zhuanlan.zhihu.com/p/627358709 遇到的问题 1、RuntimeError: Internal: src/sentencepiece_processor.cc(1101) [model_proto-ParseFromArray(serialized.data(), serialized.size())] 这是模型权重文件下载不完全或者版本不一致导致的。 解决方法是 git lfs pull 最新的权重文件。参考 2、NameError: name ‘round_up’ is not defined 这是没有安装 cpm_kernels 的缘故。使用 pip 安装即可。 参考
http://www.dnsts.com.cn/news/272150.html

相关文章:

  • jsp网站开发平台有道云笔记做网站
  • 可以做网站引导页的页面免费网站制作 最好
  • 兰溪优秀高端网站设计百度网盘网址是多少
  • 腾讯的网站是谁做的中铁建设集团公司门户
  • 免费的建设网站软件wordpress 付费 2016
  • 实验室网站模板制作公司网站的步骤
  • 学校部门网站建设情况汇报园区网站建设目的
  • 深圳网站建设 找猴王网络福清营销型网站建设方案
  • 国内网站必须备案吗国外做节目包装的网站
  • 安顺建设工程造价管理网站WordPress附件图片弹窗
  • php企业网站论文企业网站的综合要求是什么
  • 网站的颜色互联网设计公司网站
  • 南阳网站建设公司p2p提供网站建设违法
  • 普陀网站建设哪家便宜广州管网建设
  • 网站安全检测腾讯青岛城阳网站建设
  • 没有域名可以做网站开发公司电梯前室只给一楼吊顶
  • 视觉网站建设北京中关村在线官网
  • 开放大学门户网站建设方案建筑模板制作过程
  • 网站做支付功能难吗豫建市2021 42号
  • 云南做商城网站多少钱o2o好网站
  • 交互式网站樱桃企业网站管理系统
  • 新手网站建设网页设计与制作案例教程答案
  • 企业网站备案代理公司郑州电商运营培训
  • 做网站专题模板seo刷排名软件
  • 个人备案后可以做电影网站吗阿里云网站备案注销吗
  • 互联网站建设移动端是手机端吗
  • 网站服务器租用多少钱网站开发基本构成
  • 四库一平台查询系统行业门户网站的优化怎么做yps行业门户系统
  • 营销型网站制作msggwordpress同步简书
  • 如何在网上做自己的网站wordpress插件升级