浙江省高等学校教师教育理论培训

微信搜索“教师资格证岗前培训”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Java下载网页HTML代码 - 高飞航的日志 - 网易博客

Java下载网页HTML代码   

 

2010-04-15 10:36:25|  分类:
Java
|  标签: 

|字号  订阅

标签:java 下载 获取 html 代码

       通过URL获取网页的HTML代码。 

import java.io.BufferedReader; 
import java.io.InputStreamReader;


import java.net.HttpURLConnection;


import java.net.URL;

 



public class HTMLSpirit {


    
public static String getHTML(String pageURL, String encoding) {


        StringBuilder pageHTML 
= new StringBuilder();


        
try {


            URL url 
= new URL(pageURL);


            HttpURLConnection connection 
= (HttpURLConnection) url.openConnection();


            connection.setRequestProperty(
"User-Agent""MSIE 7.0");


            BufferedReader br 
= new BufferedReader(new InputStreamReader(connection.getInputStream(), encoding));


            String line 
= null;


            
while ((line = br.readLine()) != null) {


                pageHTML.append(line);


                pageHTML.append(
"\r\n");


            }


            connection.disconnect();


        } 
catch (Exception e) {


            e.printStackTrace();


        }


        
return pageHTML.toString();


    }


    


    
public static void main(String args[]){


        System.out.println(getHTML(
"http://www.baidu.com""GB2312"));


    }


}

posted on 2012-03-01 12:59  lexus  阅读(1176)  评论(0编辑  收藏  举报