zyxsyx

导航

2025年11月29日 #

数据采集作业4

摘要: 作业① 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 代码和结果 核心代码 目标爬取三个板块的股票数据,我们可以发现这三个板块分别都有自己的url,我们就采取url作为我们的爬取来源 点击查看代码 TARGET_BOAR 阅读全文

posted @ 2025-11-29 20:04 宋宋宋芽 阅读(23) 评论(0) 推荐(0)

2025年11月18日 #

数据采集作业3

摘要: 作业3 作业①: 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 –务必控制总页数(学号尾数2位)、总下载的图片数量(尾数后3位)等限制爬取的措施。 输出信息: 将下载的Url信息在控制台输出 阅读全文

posted @ 2025-11-18 22:11 宋宋宋芽 阅读(18) 评论(0) 推荐(0)

2025年11月7日 #

数据采集作业2

摘要: 作业1 在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 代码和结果 打开网站查看每一个城市对应的代码,比如图片中武汉的代码为101200101,选取4个城市的代码用于编写我们的爬虫 代码: 点击查看代码 import requests f 阅读全文

posted @ 2025-11-07 14:34 宋宋宋芽 阅读(15) 评论(0) 推荐(0)

2025年10月22日 #

作业1

摘要: 一:作业①: 用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020)的数据,屏幕打印爬取的大学排名信息。 代码部分及结果 (1)代码部分 点击查看代码 import requests f 阅读全文

posted @ 2025-10-22 23:47 宋宋宋芽 阅读(12) 评论(0) 推荐(0)