C# 批量规范HTML工具

1、问题描述:

由为知笔记导出的文件导入Evernote的时候,有一些(新建的)HTML文件以<mate>标签开头,查阅Evernote的log可知因此文件不能被导入。

责任无论归于为知还是Evernote都不重要,总之几百篇日志不可能通过复制粘贴进行导入。

 

2、工具解决问题:

批量将某一文件夹内不合规范html文件规范化。

 

3、界面

 

4、主要代码

private void button2_Click(object sender, EventArgs e)
        {
            if (folderBrowserDialog1.ShowDialog() == DialogResult.OK)
            {
                DirectoryInfo dir = new DirectoryInfo(folderBrowserDialog1.SelectedPath);
                FileInfo[] files = dir.GetFiles("*.html");
                for (int i = 0; i < files.Length; i++)
                {
                    System.IO.StreamReader sr = new System.IO.StreamReader(files[i].DirectoryName+"\\"+files[i].ToString());
                    NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(sr.ReadToEnd());
                    try
                    {
                        sr.Dispose();
                        File.Delete(files[i].DirectoryName + "\\" + files[i].ToString());
                        using (StreamWriter sw = new StreamWriter(files[i].DirectoryName+"\\"+files[i].ToString(), false, System.Text.Encoding.GetEncoding("UTF-8"))) //保存地址
                        {
                            sw.WriteLine(doc.ToString());
                            sw.Flush();
                            sw.Close();
                        }
                    }
                    catch
                    {

                    } 
                }
                Application.Exit();
            }
        }

5、源码:

环境:vs2008

组件:Nsoup.dll

http://app.yinxiang.com/shard/s12/sh/e4ef4bd5-703b-41ba-9603-6f5fbd2934b1/690319451be72d6897f434e485d45de7

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。