摘要: 综合设计——多源异构数据采集与融合应用综合实践 [码云地址](多源异构数据采集与融合应用综合实践: Call of Silence数据采集与融合综合实验 (gitee.com)) 这个项目属于哪个课程 2023数据采集与融合技术 组名、项目简介 组名:Call of Silence项目需求:设计出一 阅读全文
posted @ 2023-12-14 23:57 风宝风宝世界最好 阅读(155) 评论(0) 推荐(0)
摘要: 数据采集第四次实践作业 作业一 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://qu 阅读全文
posted @ 2023-11-16 11:42 风宝风宝世界最好 阅读(44) 评论(0) 推荐(0)
摘要: 第三次作业 作业①: 要求: 指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网( http://www.weather.com.cn )。使用scrapy框架分别实现单线程和多线程的方式爬取。 –务必控制总页数(学号尾数2位)、总下载的图片数量(尾数后3位)等限制爬取的措施。 输出信息 阅读全文
posted @ 2023-11-02 02:37 风宝风宝世界最好 阅读(37) 评论(0) 推荐(0)
摘要: 作业1: 要求:在中国气象网(http://www.weather.com.cn)给定城市集的 7日天气预报,并保存在数据库。 码云连接:https://gitee.com/cai-tianqi666/crawl_project/issues/I896BJ 点击查看代码 from bs4 impor 阅读全文
posted @ 2023-10-19 02:14 风宝风宝世界最好 阅读(27) 评论(0) 推荐(0)
摘要: 作业①: 实验要求: 用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。输出信息:排名 学校名称 省市 学校类型 总分1 清华大学 北京 综合 阅读全文
posted @ 2023-09-27 23:39 风宝风宝世界最好 阅读(41) 评论(1) 推荐(0)
摘要: 102102155;我是蔡天棋;我的爱好是睡觉,打游戏;我觉得玫瑰园二楼的蛋包饭很好吃;最喜欢歌是周董的《搁浅》,哈哈哈哈。 阅读全文
posted @ 2023-09-21 18:35 风宝风宝世界最好 阅读(15) 评论(0) 推荐(0)