摘要: 作业1 指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 核心代码 单线程: 点击查看代码 def crawl_page(self, url): """爬取单个页面""" if url in self. 阅读全文
posted @ 2025-11-25 01:53 xiaofennnn 阅读(7) 评论(0) 推荐(0)
摘要: 第二次作业 作业①: 作业代码和图片: 核心代码: 点击查看代码 # 主程序 url = "http://www.weather.com.cn/weather/101010100.shtml" city = "北京" # 初始化数据库 conn = setup_database() try: hea 阅读全文
posted @ 2025-11-11 22:51 xiaofennnn 阅读(10) 评论(0) 推荐(0)
摘要: 作业1 作业①:用requests和BeautifulSoup库方法定向爬取给定网址 http://www.shanghairanking.cn/rankings/bcur/2020 的数据,屏幕打印爬取的大学排名信息。 代码与结果 核心代码: 点击查看代码 #设置headers,模拟浏览器访问,防 阅读全文
posted @ 2025-10-27 17:14 xiaofennnn 阅读(22) 评论(0) 推荐(0)