当前位置: 首页 > news >正文

文字图片制作网站域名服务器分为

文字图片制作网站,域名服务器分为,在网站上做漂浮,logo设计方案要求#xff0c;查询一个文件中的pdf文件中的关键字#xff0c;输出关键字所在PDF文件的文件名及对应的页数。 import os import PyPDF2def search_pdf_files(folder_path, keywords):# 初始化结果字典#xff0c;以关键字为键#xff0c;值为包含关键字的页面和文件名列表…要求查询一个文件中的pdf文件中的关键字输出关键字所在PDF文件的文件名及对应的页数。 import os import PyPDF2def search_pdf_files(folder_path, keywords):# 初始化结果字典以关键字为键值为包含关键字的页面和文件名列表results {keyword: [] for keyword in keywords}# 遍历指定文件夹下的所有文件for root, dirs, files in os.walk(folder_path):for filename in files:if filename.endswith(.pdf):# 构建PDF文件的完整路径pdf_path os.path.join(root, filename)# 打开PDF文件with open(pdf_path, rb) as pdf_file:pdf_reader PyPDF2.PdfReader(pdf_file)# 获取PDF的总页数total_pages len(pdf_reader.pages)# 遍历PDF的每一页for page_num in range(total_pages):# 读取页面内容page pdf_reader.pages[page_num]page_text page.extract_text()# 检查所有关键字for keyword in keywords:if keyword in page_text:results[keyword].append({file_name: filename,page_number: page_num 1 # PDF页码从1开始})return results# 示例用法 folder_to_search rC:\Users\Administrator\Desktop\2 search_keywords [SVD, 线性回归, XGBoost, 不存在的关键字] # 添加多个关键字包括不存在的关键字 results search_pdf_files(folder_to_search, search_keywords)# 打印结果 for keyword, keyword_results in results.items():if keyword_results:print(f关键字 {keyword} 所在的文件及页数)for result in keyword_results:print(f文件 {result[file_name]} 的第 {result[page_number]} 页)else:print(f没有找到关键字 {keyword}。)print() # 输出换行以区分不同关键字的结果为了方便且高效看论文。 用了上面那个之后发现不太对劲找到文件后就可以ctrlF了所以去掉了页数。代码如下 import os import PyPDF2def search_pdf_files(folder_path, keywords):# Initialize a results dictionary with keywords as keys and lists of files as valuesresults {keyword: [] for keyword in keywords}# Initialize a set to keep track of processed files for each keywordprocessed_files {keyword: set() for keyword in keywords}# Traverse all files in the specified folderfor root, dirs, files in os.walk(folder_path):for filename in files:if filename.endswith(.pdf):# Build the full path of the PDF filepdf_path os.path.join(root, filename)# Open the PDF filewith open(pdf_path, rb) as pdf_file:pdf_reader PyPDF2.PdfReader(pdf_file)# Get the total number of pages in the PDFtotal_pages len(pdf_reader.pages)# Iterate through each page of the PDFfor page_num in range(total_pages):# Read the page contentpage pdf_reader.pages[page_num]page_text page.extract_text()# Check all keywordsfor keyword in keywords:if keyword in page_text:# Check if this file has not been processed for this keywordif filename not in processed_files[keyword]:results[keyword].append({file_name: filename,page_number: page_num 1 # PDF page numbers start from 1})processed_files[keyword].add(filename)return results# 示例用法 folder_to_search rC:\Users\Administrator\Desktop\优秀论文 search_keywords [ARIMA, XGBoost, SVM, 支持向量机,线性回归,决策树,随机森林,模拟退火,粒子群,遗传算法,LSTM,BP神经网络,t-SNE,LightGBM,GMM,距离相关系数,灰色关联分析,互信息,信息熵,递归特征消除,综合评价,熵权法] # 添加多个关键字包括不存在的关键字 results search_pdf_files(folder_to_search, search_keywords)# 打印结果 for keyword, keyword_results in results.items():if keyword_results:print(f关键字 {keyword} 所在的文件及页数)for result in keyword_results:print(f文件 {result[file_name]})else:print(f没有找到关键字 {keyword}。)print() # 输出换行以区分不同关键字的结果
http://www.dnsts.com.cn/news/177515.html

相关文章:

  • 网站的ico图标做多大深圳建站模板公司
  • 电商网站项目经验介绍金蝶财务软件官网首页
  • 视觉传达毕业设计作品网站wordpress 资讯
  • 网站推广方案怎么写的个人网站设计开题报告
  • 个人免费网站空间搭建一个网站教程
  • 设计网站要多久深圳罗湖做网站的公司
  • 电子商务网站建设与管理的重要性石家庄论坛建站模板
  • 文章修改网站内蒙古优途国际旅行社
  • 临西网站建设费用云主机网站如何备份
  • 做建材营销型网站橙色大气风格网站模板
  • 抖音小程序源码做网站优化步骤
  • 网站开发现在怎么样搜索引擎优化的定义是什么
  • google网站增加关键词WordPress微博qq登录插件
  • 2免费做网站中国房地产未来走势
  • 旅游网站改版方案做网站的硬件和软件环境
  • 外贸开发网站公司四川省建设厅官方网站首页
  • 南阳住房和城乡建设管理局网站canvas设计网站
  • 仪征建设局招投标网站设计网页价格
  • 公路水运建设质量与安全监督系统网站优秀设计案例网站
  • 7天精通网站建设实录简介242网站后期维护收费
  • 大连网站建设仟亿做盗版网站
  • 天津企业模板建站哪个好公司网站案例展示
  • 用dw做网站流程一个完整网站开发需要什么技术
  • 松江网站建设在建设一个公司网站多少钱
  • 什么网站专门做自由行的宣传册设计与制作模板
  • 培训方案网站建设找效果图的网站哪个好
  • 学校网站建设方案模板下载网络工程好找工作吗
  • 浙江杰立建设集团 网站首页自己的网站怎么做关键词
  • 网站设计是什么专业wordpress默认固定链接
  • 四川网站建设公司信息系统推广方案