102102134陈凯 - 博客园

2026年1月14日

摘要：所用语言python3.11.pycharm 数据库5.7.33-0ubuntu0.16.04.1 (Ubuntu)，工具DBeaver24.22 系统介绍：采集电影片段视频和对应字幕文本，分析场景情感并可视化展示。一Sql代码电影数据表 create table movies ( id int 阅读全文

posted @ 2026-01-14 15:53 102102134陈凯阅读(37) 评论(0) 推荐(0)

第四次作业

摘要：业①: o 要求：  熟练掌握Selenium查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。  使用Selenium框架+MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 o 候选网站：东方财富网：http://quote.eas 阅读全文

posted @ 2026-01-14 15:40 102102134陈凯阅读(19) 评论(0) 推荐(0)

2026年1月13日

第三次作业

摘要： • 作业①: – 要求：指定一个网站，爬取这个网站中的所有的所有图片，例如：中国气象网（http://www.weather.com.cn）。实现单线程和多线程的方式爬取。 – 输出信息：将下载的Url信息在控制台输出，并将下载的图片存储在images子文件中，并给出截图。核心代码`def dow 阅读全文

posted @ 2026-01-13 18:32 102102134陈凯阅读(11) 评论(0) 推荐(0)

2026年1月12日

第二次作业

摘要： • 作业①: – 要求：在中国气象网（http://www.weather.com.cn）给定城市集的7日天气预报，并保存在数据库。 – 输出信息: 我选择的是爬取福州的天气核心代码`网页爬虫模块负责从中国气象网抓取天气数据 """ import requests from bs4 import 阅读全文

posted @ 2026-01-12 16:41 102102134陈凯阅读(23) 评论(0) 推荐(0)

第一次作业

摘要： • 作业①: o 要求：用requests和BeautifulSoup库方法定向爬取给定网址（http://www.shanghairanking.cn/rankings/bcur/2020）的数据，屏幕打印爬取 o 的大学排名信息。 o 输出信息：排名学校名称省市学校类型总分`` 1 清阅读全文

posted @ 2026-01-12 14:59 102102134陈凯阅读(18) 评论(0) 推荐(0)

arisu1

公告