摘要: 作业①: 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站:东方财富网:http://quote.eastmone 阅读全文
posted @ 2025-12-07 17:43 流留六刘 阅读(21) 评论(0) 推荐(0)
摘要: 作业1 1.气象网页爬取实验 实验要求 指定一个网站,爬取这个网站中的所有的所有图片,中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 输出信息:将下载的图片保存在images子文件夹中 导入库: requests:发送请求获取数据 Beautiful 阅读全文
posted @ 2025-11-23 13:21 流留六刘 阅读(23) 评论(0) 推荐(0)
摘要: 作业① 实验要求在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 思路:爬取数据方面如之前作业,查看网页源代码,发现天气数据在"li class"属性下,采用requesets和bs4进行爬取,之后采用sqlite3将数据存入 SQLite 阅读全文
posted @ 2025-11-09 11:48 流留六刘 阅读(13) 评论(0) 推荐(0)
摘要: 作业① 1.大学排名动态网页爬取实验 实验要求用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 思路: (1)查看网页,发现为静态网页,且没有 阅读全文
posted @ 2025-10-27 14:20 流留六刘 阅读(7) 评论(0) 推荐(0)