拾霜 - 博客园

2023年12月14日

摘要：数据采集与融合技术实践多源异构数据采集与融合应用综合实践组名、项目简介 <组名：洛杉矶耐摔王、项目需求和目标：文字和音频总结、项目开展技术路线：python> 团队成员学号 102102127，102102124，102102125，102102123,102102144，102102146，1 阅读全文

posted @ 2023-12-14 22:52 拾霜阅读(112) 评论(0) 推荐(0)

2023年11月14日

数据采集与融合作业4

摘要：第四次作业作业①: 要求：熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。候选网站：东方财富网：http://quote.e 阅读全文

posted @ 2023-11-14 16:50 拾霜阅读(68) 评论(0) 推荐(0)

2023年10月25日

数据采集与融合作业3

摘要：第三次作业作业①: 要求：指定一个网站，爬取这个网站中的所有的所有图片，例如：中国气象网（http://www.weather.com.cn）。使用scrapy框架分别实现单线程和多线程的方式爬取。 –务必控制总页数（学号尾数2位）、总下载的图片数量（尾数后3位）等限制爬取的措施。输出信息: 将阅读全文

posted @ 2023-10-25 09:38 拾霜阅读(105) 评论(0) 推荐(0)

2023年10月8日

数据采集与融合作业2

摘要：第二次作业作业①: 要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。 1.代码如下点击查看代码 from bs4 import BeautifulSoup from bs4 import UnicodeDammit import 阅读全文

posted @ 2023-10-08 22:17 拾霜阅读(95) 评论(0) 推荐(0)

2023年9月22日

数据采集与融合作业1

摘要：数据采集与融合第一次作业 102102125 肖辰恺作业①: o 要求：用requests和BeautifulSoup库方法定向爬取给定网址（http://www.shanghairanking.cn/rankings/bcur/2020 ）的数据，屏幕打印爬取的大学排名信息。代码如下 impo 阅读全文

posted @ 2023-09-22 10:55 拾霜阅读(71) 评论(0) 推荐(0)

xmxck

公告