序章0 - 博客园

2025年1月17日

摘要：今天继续优化自动分类技术，并开始实现热词解释功能。早上对分类模型进行了进一步的优化，通过增加训练数据量和改进特征工程，提高了分类的准确率和召回率。下午学习了如何从百科类网站（如百度百科或维基百科）获取热词的中文解释，使用 Python 的 requests 库和 BeautifulSoup 库来爬取阅读全文

posted @ 2025-01-17 19:08 序章0 阅读(45) 评论(0) 推荐(0)

2025年1月16日

1月16日

摘要：今天学习了自动分类技术，并将其应用到大实验作业中。早上了解了常见的自动分类算法，如朴素贝叶斯、支持向量机等，通过查阅相关文献和在线教程，对这些算法的原理和应用场景有了初步的认识。下午尝试使用 Python 的机器学习库（如 scikit-learn）来实现自动分类算法，对清洗后的热词数据进行分类训练阅读全文

posted @ 2025-01-16 17:07 序章0 阅读(19) 评论(0) 推荐(0)

2025年1月15日

1月15日

摘要：今天继续完善数据采集模块，并开始进行数据清洗工作。早上优化了爬虫代码，提高了爬取效率和稳定性，同时增加了对异常情况的处理，确保爬虫能够持续稳定地运行。下午开始对爬取到的热词数据进行清洗，使用正则表达式和一些数据处理库（如 Pandas）对数据进行过滤、去重和格式化处理。通过编写清洗脚本，将数据清洗成阅读全文

posted @ 2025-01-15 23:00 序章0 阅读(24) 评论(0) 推荐(0)

2025年1月13日

1月13日

摘要：今天复习了前两天学习的 Spark RDD 和 Spark SQL 知识，并开始准备大实验作业。早上回顾了 RDD 的各种操作和 Spark SQL 的基本用法，通过做一些练习题来巩固所学知识。下午仔细阅读了大实验作业的要求，对整个项目的功能设计和实现步骤有了初步的规划。决定先从数据采集模块开始，学阅读全文

posted @ 2025-01-13 21:08 序章0 阅读(21) 评论(0) 推荐(0)

2025年1月12日

1月12日

摘要：今天学习了 Spark SQL 的基本用法。早上了解了 Spark SQL 的架构和数据源，通过创建 DataFrame 并对其进行各种操作，如选择（select）、过滤（filter）、排序（orderBy）等，熟悉了 DataFrame API 的使用。下午尝试使用 Spark SQL 进行结构阅读全文

posted @ 2025-01-12 16:40 序章0 阅读(22) 评论(0) 推荐(0)

2025年1月11日

1月11日

摘要：今天继续深入学习 Spark 的 RDD 操作。早上学习了 RDD 的持久化（persist）和缓存（cache）方法，通过实验对比了不同存储级别的性能差异，发现合理使用持久化可以大大提高后续操作的效率。下午尝试了 RDD 的键值对操作，如 groupByKey、reduceByKey 等，通过编写阅读全文

posted @ 2025-01-11 21:08 序章0 阅读(10) 评论(0) 推荐(0)

2025年1月10日

1月10日

摘要：今天开始着手进行基础的 Spark 操作实验。早上先复习了 Spark 的基本概念和架构，通过查阅官方文档和一些在线教程，对 Spark 的运行原理有了更清晰的认识。下午安装了 Spark 环境，在配置过程中遇到了一些依赖库版本不匹配的问题，经过反复尝试和查阅相关论坛，终于成功解决了，启动了 Spa 阅读全文

posted @ 2025-01-10 21:08 序章0 阅读(18) 评论(0) 推荐(0)

2024年12月24日

期末软考通过奖励加分

摘要：阅读全文

posted @ 2024-12-24 20:52 序章0 阅读(44) 评论(0) 推荐(0)

2024年12月23日

12月23日

摘要：软件需求与分析—综合案例建模分析（100 分）物料管控系统1.0【目的】规范公司生产订单物料控制、在线物料管理，指导物控人员日常作业要求。 2.0【范围】适用公司生产订单物料管理及在线物料管理过程。 3.0【定义】 3.1 A 类物料：占物料种类的 10%左右,金额占总金额的 65%左右。 3 阅读全文

posted @ 2024-12-23 20:49 序章0 阅读(112) 评论(0) 推荐(1)

2024年12月19日

12月19日

摘要：修改软件开发案例课程的作业，一个水产品进销存管理系统阅读全文

posted @ 2024-12-19 17:00 序章0 阅读(15) 评论(0) 推荐(0)

czf

公告