当前位置: 首页 > news >正文

一个网站想看访客量怎么做wordpress woocommerce主题

一个网站想看访客量怎么做,wordpress woocommerce主题,网站服务器连接被重置,织梦做的网站快照被攻击背景介绍 最近抽空参加了一个讯飞的 RAG 比赛#xff0c;耗时两周终于在最后一天冲上了榜首。 整体的框架是基于 RAG 能力有点弱弱的 Dify 实现。在比赛调优的过程中#xff0c;经常需要批量提交几百个问题至 Dify 获取回答#xff0c;并需要跟踪多轮调优的效果差异。借助…背景介绍 最近抽空参加了一个讯飞的 RAG 比赛耗时两周终于在最后一天冲上了榜首。 整体的框架是基于 RAG 能力有点弱弱的 Dify 实现。在比赛调优的过程中经常需要批量提交几百个问题至 Dify 获取回答并需要跟踪多轮调优的效果差异。借助 Langfuse 可以通过网页跟踪结果相对比较方便了很多。但是现有版本的 Langfuse 不支持提交文件构建数据集私有化部署的版本也不支持自动化评估多版本的比较很麻烦。 在比赛期间断断续续实现了一些自动化脚本进行辅助比赛结束后感觉确实很实用因此就有了这个项目 Dify-Eval, 一款补全 Dify Langfuse 组合短板的自动化工具。目前具备如下所示的功能 一键上传本地文件至 Langfuse 构建数据集;基于 Langfuse 数据集批量至 Dify并关联原始数据集全自动大模型评分多维度可拓展多版本评分比较可视化查看效果提升 从我自己的使用体验来看整体还是比较丝滑的。当然开发周期比较短暂总共耗时 3 天左右可能还有一些 bug 未发现欢迎大家作为小白鼠来试用下。 项目介绍 Dify-Eval 是为 Dify Langfuse 组合设计这个组合日常的应用监控够用了而 Dify-Eval 主要解决这个组合缺失的自动化批量测试与评估能力。框架的自动化评估是基于 Ragas 实现。详细的上手流程可以直接查看 Dify-Eval Github 整体是按照开箱即用的方案设计期望用户只需要根据自己的需求修改 .env 配置文件即可走通完整流程。实际使用基本只需要执行下面的命令 # 本地文件提交至 Langfuse并提交问题给 Dify 进行批量测试python run.py# 基于 Ragas 进行数据集自动化评估python evaluate.pyLangfuse 事实上是支持实时评估的为什么要设计为两个流程呢原因如下 评估流程比较慢自动化测试过程则快很多。合并在一起就每次测试都需要等待很久分开设计下可以根据需要自行确定是否进行自动化评估Dify 同步记录至 Langfuse 是异步完成的因此实时评估时可能会出现 Dify 提交完成但是 Langfuse 上获取不到记录从而导致评估失败的问题 所以建议先进行批量自动化测试有需要的情况下确认记录已经同步至 Langfuse 接下来执行自动化评估。 上手介绍 考虑真正需要用户修改的就是配置文件而 Dify-Eval 同时关联了 Dify, Langfuse 和 Ragas因此配置可能会稍微多一些。因此下面大概介绍下其中的配置项通过配置项基本就能大致了解项目的设计了 Langfuse 配置 Langfuse 相关的配置如下所示 # Langfuse 的公钥私钥与地址LANGFUSE_PUBLIC_KEYpk-lf- LANGFUSE_SECRET_KEYsk-lf- LANGFUSE_HOSThttp://localhost:3000/这部分就是连接 Langfuse 的凭证和地址对应的获取路径可以参考下图 DATASET_NAME数据集 RUN_NAME版本v1DATASET_NAME 对应的是一个 Langfuse 测试数据集一个测试数据集中包含多个测试项每个测试项对应的就是一个测试问题。 RUN_NAME 对应的就是基于测试数据集的一次完整的自动化测试。因此可想而知基于 DATASET_NAME 可以多次进行测试一般情况下建议修改 RUN_NAME 进行区分方便后续跟踪效果的比较。 比如下图中就是基于同样的数据集进行了两次测试对应的 RUN_NAME 分别为 版本v1 和 版本v2。 Dify 配置 Dify 相关的配置如下所示 DIFY_API_BASEhttp://localhost:58882/v1 DIFY_API_KEYapp-这部分就是连接 Dify 应用的凭证对应的获取路径可以参考下图 Ragas 评估 Ragas 评估相关的配置如下所示 RAGAS_BASE_URLhttp://localhost:9997/v1 RAGAS_EVAL_LLMqwen2-instruct RAGAS_EMBEDDINGbge-m3 RAGAS_API_KEYcannot be emptyRagas 评估时需要使用大模型和嵌入模型因此需要配置对应的地址和模型名称理论上 OpenAI 格式的大模型和嵌入服务都是支持的。 实际测试时是基于私有化部署的 Xinference 服务完成的实际也是可以支持的。我实际运行的效果如下所示 输入输出文件 输入输出文件相关的配置如下所示 LOCAL_FILE_PATHexample.csv OUTPUT_FILE_PATH输入文件的格式为 .csv其中 question 对应的是测试问题answer 对应的是测试答案。 考虑到部分情况下可能没有正确答案项目支持只包含 question 列同样可以完成批量测试。 但是熟悉 Ragas 评估的研发同学应该知道没有正确答案时Ragas 的部分评估指标是无法支持的因此在执行前可能会需要将 evaluate.py 中的 DEFAULT_METRICS 中不支持的指标去掉就可以愉快地进行测试了。具体哪些指标不支持可以参考下 Ragas Metrics 文档 输出文件的格式为 .csv 默认为空情况下会输出至 results/ 目录下。 总结 整体而言Dify-Eval 是一个比较趁手的小工具补全 Dify Langfuse 组合的一些明显短板从目前的使用来看还不错欢迎有需要的试用下。暂时没用上的可以 star 关注下说不定明天就用上了。 当然目前项目还处于早期阶段可能会存在一些 bug欢迎大家反馈和提供 Pull Request。
http://www.dnsts.com.cn/news/53481.html

相关文章:

  • 某企业网站搜索引擎优化wordpress主题移动端
  • 网络营销推广的主要目标西安关键词seo
  • 企业网站推广属于付费网站诊断报告案例
  • 建设一个自己的网站承德市外贸网站建设
  • 网站现在怎么做排名node.js网站开发合适吗
  • 网站空间服务商查询安卓Wordpress汉化版
  • 厦门网站开发建设凡科网站开发
  • 高埗镇做网站新校区建设网站
  • 郑州网站建设更好东莞保安公司排名前十
  • 网站交换链接怎么做设计深圳网站制作
  • 如何做网站好看wordpress中文案例
  • 网站开发实战asp制作视频教程做公司网站的总结
  • 苏州建站模板厂家网站icp备案时间
  • 手机微信网站怎么做的好北京定制网站公司
  • 国内设计网站推荐小米路由器mini做网站
  • 站长工具果冻传媒做一个短视频app需要多少钱
  • 松江新城建设发展有限公司网站网站谁做的比较好看
  • 怎么做关于易烊千玺的网站南昌定制网站建设
  • wordpress和网站区别qq空间如何做微网站
  • 石家庄网站建设价格低网站空间速度
  • 响应式网站建设费用低价网站建设浩森宇特
  • ipad网站开发重庆招投标综合信息网
  • 做单页网站要多少钱哪些网站上可以做seo推广的
  • wordpress建外贸网站软件开发培训学校哪的好
  • 化妆品网站的搭建好看的seo网站
  • 互动网门户网站建设企业网站开发实训报告
  • 织梦网站字体大小seo网站做推广价格
  • 重庆麻花制作seo的方式包括
  • 做外贸的网站公司用易语言做抢购网站软件下载
  • 唐山市城乡建设网站有没有咨询求助做任务的网站