摘要: 所用语言python3.11.pycharm 数据库5.7.33-0ubuntu0.16.04.1 (Ubuntu),工具DBeaver24.22 系统介绍:采集电影片段视频和对应字幕文本,分析场景情感并可视化展示。 一Sql代码 电影数据表 create table movies ( id int 阅读全文
posted @ 2026-01-14 15:53 102102134陈凯 阅读(32) 评论(0) 推荐(0)
摘要: 业①: o 要求:  熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。  使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 o 候选网站:东方财富网:http://quote.eas 阅读全文
posted @ 2026-01-14 15:40 102102134陈凯 阅读(15) 评论(0) 推荐(0)
摘要: • 作业①: – 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网(http://www.weather.com.cn)。实现单线程和多线程的方式爬取。 – 输出信息:将下载的Url信息在控制台输出,并将下载的图片存储在images子文件中,并给出截图。 核心代码`def dow 阅读全文
posted @ 2026-01-13 18:32 102102134陈凯 阅读(8) 评论(0) 推荐(0)
摘要: • 作业①: – 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 – 输出信息: 我选择的是爬取福州的天气 核心代码`网页爬虫模块 负责从中国气象网抓取天气数据 """ import requests from bs4 import 阅读全文
posted @ 2026-01-12 16:41 102102134陈凯 阅读(18) 评论(0) 推荐(0)
摘要: • 作业①: o 要求:用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020)的数据,屏幕打印爬取 o 的大学排名信息。 o 输出信息: 排名 学校名称 省市 学校类型 总分`` 1 清 阅读全文
posted @ 2026-01-12 14:59 102102134陈凯 阅读(16) 评论(0) 推荐(0)