【开源工具】C# 批量规范HTML工具
1、问题描述:
由为知笔记导出的文件导入Evernote的时候,有一些(新建的)HTML文件以<mate>标签开头,查阅Evernote的log可知因此文件不能被导入。
责任无论归于为知还是Evernote都不重要,总之几百篇日志不可能通过复制粘贴进行导入。
2、工具解决问题:
批量将某一文件夹内不合规范html文件规范化。
3、界面

4、主要代码
private void button2_Click(object sender, EventArgs e)
{
if (folderBrowserDialog1.ShowDialog() == DialogResult.OK)
{
DirectoryInfo dir = new DirectoryInfo(folderBrowserDialog1.SelectedPath);
FileInfo[] files = dir.GetFiles("*.html");
for (int i = 0; i < files.Length; i++)
{
System.IO.StreamReader sr = new System.IO.StreamReader(files[i].DirectoryName+"\\"+files[i].ToString());
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(sr.ReadToEnd());
try
{
sr.Dispose();
File.Delete(files[i].DirectoryName + "\\" + files[i].ToString());
using (StreamWriter sw = new StreamWriter(files[i].DirectoryName+"\\"+files[i].ToString(), false, System.Text.Encoding.GetEncoding("UTF-8"))) //保存地址
{
sw.WriteLine(doc.ToString());
sw.Flush();
sw.Close();
}
}
catch
{
}
}
Application.Exit();
}
}
5、源码:
环境:vs2008
组件:Nsoup.dll
https://files.cnblogs.com/files/yixiaozi/NsoupApplication.zip
可执行程序:https://files.cnblogs.com/files/yixiaozi/FormatHtml.zip

浙公网安备 33010602011771号