dotnet c# html XPath

包安装

nuget包名 HtmlAgilityPack

文档地址 https://html-agility-pack.net/documentation

加载

// 文件加载
var doc = new HtmlDocument();
doc.Load(filePath);

// 字符串加载
var doc = new HtmlDocument();
doc.LoadHtml(html);

// url地址加载
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

查找

// XPath 方式
var value = doc.DocumentNode
 .SelectNodes("//td/input")
 .First()
 .Attributes["value"].Value;
 
// LINQ 方式
var nodes = doc.DocumentNode.Descendants("input")
 .Select(y => y.Descendants()
 .Where(x => x.Attributes["class"].Value == "box"))
 .ToList();

节点操作

var doc = new HtmlDocument();
doc.LoadHtml(html);

// 节点html InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// 节点text InnerText 
var innerText = doc.DocumentNode.InnerText;

// 节点属性 Attributes 
var attrHref = doc.DocumentNode.Attributes["href"];
posted @ 2021-05-08 16:33  忆秋年枫叶情  阅读(216)  评论(0)    收藏  举报