dotnet c# html XPath
包安装
nuget包名 HtmlAgilityPack
加载
// 文件加载
var doc = new HtmlDocument();
doc.Load(filePath);
// 字符串加载
var doc = new HtmlDocument();
doc.LoadHtml(html);
// url地址加载
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);
查找
// XPath 方式
var value = doc.DocumentNode
.SelectNodes("//td/input")
.First()
.Attributes["value"].Value;
// LINQ 方式
var nodes = doc.DocumentNode.Descendants("input")
.Select(y => y.Descendants()
.Where(x => x.Attributes["class"].Value == "box"))
.ToList();
节点操作
var doc = new HtmlDocument();
doc.LoadHtml(html);
// 节点html InnerHtml
var innerHtml = doc.DocumentNode.InnerHtml;
// 节点text InnerText
var innerText = doc.DocumentNode.InnerText;
// 节点属性 Attributes
var attrHref = doc.DocumentNode.Attributes["href"];

浙公网安备 33010602011771号