• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

cynchanpin

  • 博客园
  • 联系
  • 订阅
  • 管理

View Post

asp.net C# 获取网页源代码的几种方式

1 方法
               System.Net.WebClient aWebClient = new System.Net.WebClient();
               aWebClient.Encoding = System.Text.Encoding.Default;
               Byte[] pageData = aWebClient.DownloadData(url);
           
               string nhtml = Encoding.GetEncoding("utf-8").GetString(pageData);

2方法

                System.Net.WebClient aWebClient = new System.Net.WebClient();
                aWebClient.Encoding = System.Text.Encoding.Default;
                string nhtml = aWebClient.DownloadString(goodstidurl);

3方法
               WebBrowser webbrowser = new WebBrowser();
                StreamReader sr = new StreamReader(this.webBTaobao.DocumentStream, Encoding.Default);
                html = sr.ReadToEnd();
                html = html.Replace("\r\n", "");
                html = html.Replace("\n", "");
                html = html.Replace("  ", "");
                html = html.Replace("(", "");
                html = html.Replace(")", "");
                string nurl = Regex.Match(html, "(?<=data-url=\").*?(?=\")").Value;
                //新建一个WebBrowser
                WebBrowser webAddress = new WebBrowser();
                webAddress.Navigate(nurl);
                //等待载入完毕
                while (webAddress.ReadyState < WebBrowserReadyState.Complete) Application.DoEvents();
                StreamReader sraddress = new StreamReader(webAddress.DocumentStream, Encoding.Default);
                jsonaddress = sraddress.ReadToEnd();

4方法

            WebRequest hwr = WebRequest.Create(@"http://item.taobao.com/item.htm?

id=" + row["urlId"].ToString());//向指定Url发出请求 HttpWebResponse hwp = hwr.GetResponse() as HttpWebResponse;//将hwr对HTTP的请求 string text; StreamReader sr; string code = hwp.ContentType;//请求响应得到的内容类型 //得到编码了 code = code.Split('=')[1]; Stream rep = hwp.GetResponseStream();//将请求得到的内容以流的形式读出 sr = new StreamReader(rep, Encoding.GetEncoding(code));//用指定的字符编码为指定的流初始化



posted on 2017-06-23 12:20  cynchanpin  阅读(682)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3