分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 前端开发

使用Html Agility Pack快速解析Html内容

发布时间:2023-09-06 02:29责任编辑:胡小海关键词:暂无标签

Html Agility Pack 是一个开源的.NET 方案HTML解析器。

开源地址:https://github.com/zzzprojects/html-agility-pack

用法:vs上通过Nuget搜索Html Agility Pack并安装

示例代码1:

 ???????/// <summary> ???????/// 获取网页内容 ???????/// </summary> ???????/// <returns></returns> ???????private static string GetHtml() ???????{ ???????????string html = string.Empty; ???????????string url = "http://quote.eastmoney.com/stocklist.html"; ???????????using (var client = new HttpClient()) ???????????{ ???????????????client.BaseAddress = new Uri(url); ???????????????//关键代码1:设置请求头采用GZip和deflate两种压缩算法 ???????????????client.DefaultRequestHeaders.Add("Accept-Encoding", "gzip, deflate"); ???????????????var response = client.GetAsync(url).Result; ???????????????var fileStream = response.Content.ReadAsStreamAsync().Result; ???????????????//关键代码2:对文件流采用GZip算法解压 ???????????????GZipStream gzip = new GZipStream(fileStream, CompressionMode.Decompress); ???????????????using (StreamReader reader = new StreamReader(gzip, Encoding.GetEncoding("gb2312")))//中文编码处理 ???????????????{ ???????????????????html = reader.ReadToEnd(); ???????????????????//File.WriteAllText(@"C:\stock.html", reader.ReadToEnd(), Encoding.Default); ???????????????} ???????????} ???????????return html; ???????}

示例代码2:

 ???????static void Main(string[] args) ???????{ ???????????string html= GetHtml(); ???????????var doc = new HtmlDocument(); ???????????doc.LoadHtml(html); ???????????//查找dom节点div的Id为quotesearch下所有ul下的li下的所有a节点 ???????????var nodes = doc.DocumentNode.SelectNodes("//div[@id=‘quotesearch‘]/ul/li/a"); ???????????foreach (var node in nodes) ???????????{ ???????????????var arrays=node.InnerText.Split(‘(‘); ???????????????Console.WriteLine(string.Format("股票名称:{0},股票代码:{1}", arrays[0], arrays[1].Replace(")",""))); ???????????} ???????????//File.WriteAllText(@"C:\stock.html", matches.ToString(), Encoding.Default); ???????????Console.ReadKey(); ???????}

使用Html Agility Pack快速解析Html内容

原文地址:https://www.cnblogs.com/wgx0428/p/10262040.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved