当前位置: 首页 > news >正文

花都网站(建设信科网络)深圳外贸人才网

花都网站(建设信科网络),深圳外贸人才网,影视传媒公司,优设网官网教程转载#xff1a;蚂蚁学python 网址#xff1a;【【2021最新版】Python 并发编程实战#xff0c;用多线程、多进程、多协程加速程序运行】 https://www.bilibili.com/video/BV1bK411A7tV/?p8share_sourcecopy_webvd_sourced0ef3d08fdeef1740bab49cdb3e96467实战案…转载蚂蚁学python 网址【【2021最新版】Python 并发编程实战用多线程、多进程、多协程加速程序运行】 https://www.bilibili.com/video/BV1bK411A7tV/?p8share_sourcecopy_webvd_sourced0ef3d08fdeef1740bab49cdb3e96467实战案例对于网络爬虫来讲是属于I/O 操作,比较适用多线程爬虫多进程就不太适合如果对协程分支异步编程asyncio 较为熟悉的话也很方便。小项目任务获取博客园文章标题以及访问连接当然你也可以去访问本网站csdn需要改变的代码部分访问网址以及通过正则提取网页数据网页请求代码这里只是通过单线程串行的方式获取了一页数据blog_spider 文件先创建这样以 blog_spider 命名的python文件import requests import re urls [fhttps://www.cnblogs.com/#p{page}for page in range(1,51)] def craw(url):r requests.get(url).textreturn rdef parse(html):url_Data re.findall(a classpost-item-title href(.*?) target_blank(.*?)/a,html)return url_Data if __name__ __main__:for result in parse(craw(urls[3])):print(result) 在创建一个名为 thread_pool python文件import concurrent.futures import pprintimport blog_spider #这里是导入自己写的一个包我的理解是封装成一个包或者是模块可以供其他python文件调用 with concurrent.futures.ThreadPoolExecutor() as pool:htmls pool.map(blog_spider.craw,blog_spider.urls)htmls list(zip(blog_spider.urls,htmls))for url,html in htmls:print(url,len(html)) print(craw over) with concurrent.futures.ThreadPoolExecutor()as pool:futures {}for url,html in htmls:future pool.submit(blog_spider.parse,html)futures[future] urlfor future in concurrent.futures.as_completed(futures):url futures[future]print(url,future.result())关于多进程和多线程的关系进程适用cpu密集型线程适用IO密集型线程是由进程所创建的创建一个进程会自动帮你创建一个主线程由主线程可以创建其他子线程线程的数量是有限的因为python由于 GIL(全局事务解释器)锁的限定无论你是多核cpu但是只允许你在同一时间执行一个线程在请求IO时线程是在不定时进行切换的会损耗一定的资源如果线程数量过多线程的切换开销过大这样就会抵消多线程带来的速度优势。第五十页请求到的数据看看获取的数据是否正确检查了一下的确数据不对有可能是反扒机制识别等待时间和网址信息填充存在问题我已经排除我太忙了有时间我会在看看。
http://www.dnsts.com.cn/news/264790.html

相关文章:

  • 韶关网站建设公司网页制作第3版素材
  • 网站建设技术有哪些网站的图文链接怎么做
  • 做网站的作用中小企业建站平台
  • 文山网站建设公司肇庆做网约车
  • 深圳商业网站建设哪家好网站首页的重要性
  • 怎么做展示网站保定网站制作哪家好建设
  • 哈尔滨网站建设 博客做社交网站怎么赚钱
  • 群晖如何做网站服务器新品推广计划与方案
  • 网站seo优化分析报告网站开发相关书籍
  • 携程旅游网官方网站 做攻略怎么做网站商城
  • 网站建设sz886网站图片的作用
  • pc网站转换成app网站开发流程记住吧
  • 做ppt的模板的网站有哪些渭南网站建设公司
  • wordpress开发小工具东莞网站优化推广方案
  • visual composer wordpress.org深圳seo关键词优化外包公司
  • 网站建设需要用到什么网站建设技术合同
  • 做网站导航一般字号是多少搜狗搜索旧版本
  • 注册网站多少钱中国设计师网站
  • 网站开发员纵向发展网站改版会降权吗
  • 免费书画网站怎么做的寻网站开发人员合作
  • 网站建设廴金手指花总壹陆公司网络组建工作方案
  • 视频网站的建设预算网站建设费用怎么入账
  • 网站模板后台怎么做大英县住房和城乡建设局网站
  • 网站建设地带万网域名管理平台
  • 两个网站合并建设实施方案房屋设计公司品牌排行
  • 南京网站建设公司 w棋牌app软件开发
  • 建网360 网站建设工信部网站黑名单
  • 外贸网站如何seo海南最新通知今天重要消息
  • 最新网站南京网站建设价位
  • 英铭网站建设制作个人业务网站