当前位置: 首页 > news >正文

网站优化服务杭州专业网站设计

网站优化服务,杭州专业网站设计,网站产品展示模板,长沙市网站推广多少钱Unity C# 之 Http 获取网页的 html 数据#xff0c;并去掉 html 格式等相关信息 目录 Unity C# 之 Http 获取网页的 html 数据#xff0c;并去掉 html 格式等相关信息 一、简单介绍 二、实现原理 三、注意事项 四、效果预览 五、关键代码 一、简单介绍 Unity中的一些知…Unity C# 之 Http 获取网页的 html 数据并去掉 html 格式等相关信息 目录 Unity C# 之 Http 获取网页的 html 数据并去掉 html 格式等相关信息 一、简单介绍 二、实现原理 三、注意事项 四、效果预览 五、关键代码 一、简单介绍 Unity中的一些知识点整理。 本节简单介绍在Unity开发中的使用 HttpClient获取指定网页的相关信息然后进行数据清洗去掉html 格式以及标签函数多余的空格等信息仅留下和网页显示差不多的文字信息为什么这么做呢其实这里一个使用场景是把网页数据喂给GPT然后让 GPT 进行处理总结如果你有新的方式也可以留言多谢。 二、实现原理 1、HttpClient 获取指定网页的 html 数据 2、使用 HtmlAgilityPack 进行 html 的数据进行 去除所有的script标签及其内容获取纯文本内容最后再去除多余的空格和空行 三、注意事项 1、直接代码访问网页最好添加上 User-Agent不然可能不能正常访问 2、注意 NuGet 安装  HtmlAgilityPack  包 四、效果预览 五、关键代码 using HtmlAgilityPack; using System; using System.Linq; using System.Net.Http; using System.Text.RegularExpressions;namespace TestHtml {class Program{static async System.Threading.Tasks.Task Main(string[] args){//string url https://movie.douban.com/chart;//string url http://www.weather.com.cn/;//string url https://movie.douban.com/;//string url http://time.tianqi.com/;string url http://time.tianqi.com/shenzhen/;string htmlContent htmlheadtitleSample Page/titlescriptfunction myFunction() {alert(Hello!);}/script/headbodyh1Welcome to My Page/h1pThis is a sample page with some content./p/body/html;using (HttpClient client new HttpClient()){// 设置请求头以模拟浏览器访问client.DefaultRequestHeaders.Add(User-Agent, Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3);// 访问网页并获取HTML内容htmlContent await client.GetStringAsync(url);// 输出获取的HTML内容//Console.WriteLine(htmlContent);}// 创建HtmlDocument对象并加载HTML内容HtmlDocument doc new HtmlDocument();doc.LoadHtml(htmlContent);// 去除所有的script标签及其内容foreach (var script in doc.DocumentNode.DescendantsAndSelf(script).ToArray()){script.Remove();}// 获取纯文本内容string text doc.DocumentNode.InnerText;// 去除多余的空格和空行text Regex.Replace(text, \s, ).Trim();// 输出展示内容Console.WriteLine(text);}} }
http://www.dnsts.com.cn/news/165006.html

相关文章:

  • 保健品网站建设方案书模板wordpress怎么修改文字大小
  • 灵感集网站如何自学wordpress
  • wordpress html单页长沙正规seo优化价格
  • 吉林省白山市建设厅网站首页东莞企业制作网站
  • 武邑网站建设微网站开发项目合作协议
  • 上海黑马网站制作培训机构还能开吗
  • 茂名公司网站开发专业建设规划ppt
  • 中山网站建设公司哪家好商标图案自动生成
  • 旅游网站建设需求说明书可信赖的郑州网站建设
  • 学校门户网站建设的优势南宁做网站比较好的公司
  • 网站的建设ppt模板dz门户网站模板
  • 重庆建站公司官网好看的页面设计
  • 建设银行儿童网站济南章丘网站建设
  • 简单个人网站网站推广工作如何做
  • 京东网站建设过程成色好的y31s标准版下载
  • 如何编写网站建设wordpress字体编辑插件下载
  • 建站公司跑路了域名怎么办深圳网络营销网站建设
  • 网站开发语言统计抖音代运营套餐价格表
  • 网站需求建设关系书网站备案需要具备什么
  • 杭州建站模板展示毕设做网站答辩稿
  • 如何建设软件下载网站织梦做网站需要钱吗
  • 如何建设自己网站迅雷下载磁力天堂
  • 网站建设分金手指排名五类似WordPress的Python
  • 如何保护网站模板国外 wordpress模板下载地址
  • 90后小姑娘做网站中国建设银行网站特色
  • 仿站侵权吗wordpress 3源码
  • 中国建设银行网站客户注册码简约 网站
  • 云服务器建设网站软件网站的建设外链优化
  • 做电影网站需要的服务器配置网页设计师培训费
  • 论前端对网站建设的重要性wordpress 高德地图