摘要: 这个项目属于哪个课程 2023数据采集与融合技术 作业要求 综合设计——多源异构数据采集与融合应用综合实践 组名 汪汪队 项目主题 微博评论情感分析 项目简介 项目需求:1. 情绪监测、2. 品牌声誉管理、3. 市场分析、4. 舆论引导、5. 个性化推荐、6. 社交网络分析 项目目标: 1. 情绪识 阅读全文
posted @ 2023-12-14 23:17 chencanming 阅读(113) 评论(0) 推荐(0)
摘要: 一、作业内容 码云链接 ccm4 · 陈灿铭/2023级数据采集与融合技术 - 码云 - 开源中国 (gitee.com) 作业①: 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪 阅读全文
posted @ 2023-11-15 22:59 chencanming 阅读(42) 评论(0) 推荐(0)
摘要: 作业要求 码云地址 第一题 pipelines: 单线程 import threading from itemadapter import ItemAdapter import urllib.request import os import pathlib import pymysql from P 阅读全文
posted @ 2023-11-02 01:49 chencanming 阅读(29) 评论(0) 推荐(0)
摘要: 第二次作业 码云连接:https://gitee.com/crazypsz/spider/commit/566b31106cde3cd68bd87c63e851b299542e6565 作业一 实验 要求:在中国气象网(http://www.weather.com.cn)给定城市集的 7日天气预报 阅读全文
posted @ 2023-10-19 00:48 chencanming 阅读(29) 评论(0) 推荐(0)
摘要: 作业1 要求:用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 输出信息: 排名 学校名称 省市 学校类型 总分 1 清华大学 北京 综合 8 阅读全文
posted @ 2023-09-28 10:45 chencanming 阅读(67) 评论(0) 推荐(0)