WinForm开发浏览器，WebBrowser获取页面内容，解决中文乱码

C#写一个简单的浏览器，遇到一个小小的问题，即：在通过WebBrowser.DocumentText获取的页面内容是乱码

System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding("gb2312"));
string gethtml = getReader.ReadToEnd();

注意：这儿使用的不是DocumentText属性获取的页面内容。

UTF8编码方式,只是在读取的时候,指定为UTF8即可啊.
System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding("utf8"));

WebBrowser的编码可以从文档对象中获得，将代码改为如下即可。

System.IO.StreamReader getReader = new System.IO.StreamReader(this.webBrowser.DocumentStream, System.Text.Encoding.GetEncoding(this.webBrowser.Document.Encoding));
string gethtml = getReader.ReadToEnd();

posted on 2008-12-28 03:38 阿C's 阅读(4052) 评论(0) 收藏举报