C#从剪贴板获取HTML格式内容含中文字符出现的问题和解决方法

通过如下代码在剪贴板中获取含HTML格式的文本时发现当内容出现汉字的时候会有乱码

if (Clipboard.ContainsText(TextDataFormat.Html))

    textBox1.Text = Clipboard.GetText(TextDataFormat.Html);

通过剪贴板工具分析，HTML格式的文本是UTF8编码方式
看来Clipboard.GetText()是解码出了问题
那就自己来完成这个解码工作吧！

if (Clipboard.ContainsText(TextDataFormat.Html))

{

    MemoryStream vMemoryStream = 

        Clipboard.GetData("Html Format") as MemoryStream;

    vMemoryStream.Position = 0;

    byte[] vBytes = new byte[vMemoryStream.Length];

    vMemoryStream.Read(vBytes, 0, (int)vMemoryStream.Length);

    textBox1.Text = Encoding.UTF8.GetString(vBytes);

}

转：http://www.csharpwin.com/csharpspace/9097r5853.shtml

WebBrowser 设置编码的原型代码：

IHTMLDocument2 m_hDoc = (IHTMLDocument2)axWebBrowser1.Document;
m_hDoc.charset = "gb2312";

posted @ 2011-02-16 07:49 把爱延续阅读(2042) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

C#从剪贴板获取HTML格式内容含中文字符出现的问题和解决方法

公告