爬取历史天气
1.爬取了2016到18年三年的 西安和郑州的天气数据,其中有部分缺少 部分,下面链接时爬取的数据和C#代码。
百度链接:https://pan.baidu.com/s/10xZu1RFA1tsjek6WEiA2Fw
提取码:ovcw
数据格式如下:

数据从https://www.163sha.com里面爬取的,用HttpClient获取网页,然后用HtmlAgilityPack解析网页获取对应的数据,存到数据库里面,具体看上传的代码吧。
推荐一个比较不错的网站 https://darksky.net/ 嵌入进去看还是不错的。
上次的数据不太好,然后又换了一个网址:http://tianqi.2345.cn/com/wea_history/js/201806/57083_201806.js
上面: 57083是郑州的城市编码
57036是西安的城市编码
网站的js图所示:

可以很方便的获取所有的数据。
另外关于每天数据的增量问题:推荐百度官方提供的网站:http://flash.weather.com.cn/baidumap/xml/china.xml 这个网站的数据是每天更新的,所以做个定时任务很方便更新数据

浙公网安备 33010602011771号