爬取历史天气

1.爬取了2016到18年三年的 西安和郑州的天气数据,其中有部分缺少 部分,下面链接时爬取的数据和C#代码。

百度链接:https://pan.baidu.com/s/10xZu1RFA1tsjek6WEiA2Fw
提取码:ovcw

数据格式如下:

 

数据从https://www.163sha.com里面爬取的,用HttpClient获取网页,然后用HtmlAgilityPack解析网页获取对应的数据,存到数据库里面,具体看上传的代码吧。

推荐一个比较不错的网站 https://darksky.net/ 嵌入进去看还是不错的。

 

上次的数据不太好,然后又换了一个网址:http://tianqi.2345.cn/com/wea_history/js/201806/57083_201806.js

上面: 57083是郑州的城市编码
57036是西安的城市编码

网站的js图所示:

 

 可以很方便的获取所有的数据。

另外关于每天数据的增量问题:推荐百度官方提供的网站:http://flash.weather.com.cn/baidumap/xml/china.xml  这个网站的数据是每天更新的,所以做个定时任务很方便更新数据

posted @ 2019-06-24 18:08  国产小品牌  阅读(179)  评论(0)    收藏  举报