[java] jsoup 解析网页获取省市区域信息

 

到国家统计局抓取数据,

到该class下解析数据

 

/**
 * jsoup解析网页
 * @author xwolf
 * @date 2016-12-13 18:11
 * @since V1.0.0
 */
public class JsoupUtil {

    public static JSONObject parse(String url){
        JSONObject json=new JSONObject();
        URL purl= null;
        try {
            purl = new URL(url);
            Document document=Jsoup.parse(purl,1000);
            Element elements=document.body();
           Elements findEles= elements.getElementsByClass("MsoNormal");

           for(Element ele:findEles){
              Elements langSpans= ele.getElementsByAttribute("lang");
              Elements  nameSpans=ele.getElementsByAttribute("style");
               for(int i=0;i<langSpans.size();i++){
                   json.put(langSpans.get(i).text().trim(),nameSpans.get(i).text().trim());
               }
           }
           return json;
        } catch (Exception e) {
            e.printStackTrace();
        }
          return null;
    }

    public static void main(String[] args) {
       JSONObject json= parse("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html");
        System.out.println(json.toJSONString());
    }

 

返回json,处理入库即可。

 

附件:省市区域信息.zip

 

posted @ 2016-12-13 18:48  snow__wolf  阅读(239)  评论(0编辑  收藏  举报