上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 24 下一页
摘要: 今天继续优化自动分类技术,并开始实现热词解释功能。早上对分类模型进行了进一步的优化,通过增加训练数据量和改进特征工程,提高了分类的准确率和召回率。下午学习了如何从百科类网站(如百度百科或维基百科)获取热词的中文解释,使用 Python 的 requests 库和 BeautifulSoup 库来爬取 阅读全文
posted @ 2025-01-17 19:08 序章0 阅读(29) 评论(0) 推荐(0)
摘要: 今天学习了自动分类技术,并将其应用到大实验作业中。早上了解了常见的自动分类算法,如朴素贝叶斯、支持向量机等,通过查阅相关文献和在线教程,对这些算法的原理和应用场景有了初步的认识。下午尝试使用 Python 的机器学习库(如 scikit-learn)来实现自动分类算法,对清洗后的热词数据进行分类训练 阅读全文
posted @ 2025-01-16 17:07 序章0 阅读(8) 评论(0) 推荐(0)
摘要: 今天继续完善数据采集模块,并开始进行数据清洗工作。早上优化了爬虫代码,提高了爬取效率和稳定性,同时增加了对异常情况的处理,确保爬虫能够持续稳定地运行。下午开始对爬取到的热词数据进行清洗,使用正则表达式和一些数据处理库(如 Pandas)对数据进行过滤、去重和格式化处理。通过编写清洗脚本,将数据清洗成 阅读全文
posted @ 2025-01-15 23:00 序章0 阅读(15) 评论(0) 推荐(0)
摘要: 今天复习了前两天学习的 Spark RDD 和 Spark SQL 知识,并开始准备大实验作业。早上回顾了 RDD 的各种操作和 Spark SQL 的基本用法,通过做一些练习题来巩固所学知识。下午仔细阅读了大实验作业的要求,对整个项目的功能设计和实现步骤有了初步的规划。决定先从数据采集模块开始,学 阅读全文
posted @ 2025-01-13 21:08 序章0 阅读(8) 评论(0) 推荐(0)
摘要: 今天学习了 Spark SQL 的基本用法。早上了解了 Spark SQL 的架构和数据源,通过创建 DataFrame 并对其进行各种操作,如选择(select)、过滤(filter)、排序(orderBy)等,熟悉了 DataFrame API 的使用。下午尝试使用 Spark SQL 进行结构 阅读全文
posted @ 2025-01-12 16:40 序章0 阅读(13) 评论(0) 推荐(0)
摘要: 今天继续深入学习 Spark 的 RDD 操作。早上学习了 RDD 的持久化(persist)和缓存(cache)方法,通过实验对比了不同存储级别的性能差异,发现合理使用持久化可以大大提高后续操作的效率。下午尝试了 RDD 的键值对操作,如 groupByKey、reduceByKey 等,通过编写 阅读全文
posted @ 2025-01-11 21:08 序章0 阅读(6) 评论(0) 推荐(0)
摘要: 今天开始着手进行基础的 Spark 操作实验。早上先复习了 Spark 的基本概念和架构,通过查阅官方文档和一些在线教程,对 Spark 的运行原理有了更清晰的认识。下午安装了 Spark 环境,在配置过程中遇到了一些依赖库版本不匹配的问题,经过反复尝试和查阅相关论坛,终于成功解决了,启动了 Spa 阅读全文
posted @ 2025-01-10 21:08 序章0 阅读(10) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2024-12-24 20:52 序章0 阅读(37) 评论(0) 推荐(0)
摘要: 软件需求与分析—综合案例建模分析(100 分) 物料管控系统1.0【目的】 规范公司生产订单物料控制、在线物料管理,指导物控人员日常作业要求。 2.0【范围】 适用公司生产订单物料管理及在线物料管理过程。 3.0【定义】 3.1 A 类物料:占物料种类的 10%左右,金额占总金额的 65%左右。 3 阅读全文
posted @ 2024-12-23 20:49 序章0 阅读(57) 评论(0) 推荐(0)
摘要: 修改软件开发案例课程的作业,一个水产品进销存管理系统 阅读全文
posted @ 2024-12-19 17:00 序章0 阅读(7) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 24 下一页