第二周学习进度总结报告

一、本周学习情况
本周延续了第一周的学习节奏,围绕 JAVA WEB、大数据技术、Python 及软件设计师备考四大模块推进,学习状态更稳定,累计投入学习时间 32 小时,其中代码实践 19 小时,问题解决时间 5 小时,知识点梳理与资料整合 8 小时。
JAVA WEB 技术:聚焦 SERVLET 核心功能与 JSP 内置对象。深入学习请求转发(RequestDispatcher)与重定向(sendRedirect)的区别,通过 “用户注册后跳转至登录页” 案例,明确前者服务器内跳转、后者客户端跳转的逻辑差异;完成 “用户注册 - 登录 - 个人信息展示” 完整流程开发,涉及表单数据验证(非空、格式校验)、session 会话存储用户状态,解决了 “登录后直接访问个人信息页未拦截” 的问题(通过过滤器 Filter 实现登录校验)。同时,掌握 JSP 内置对象 request、response、session 的常用方法,例如通过 request 获取表单参数、通过 session 存储用户登录状态,累计编写代码约 800 行。
大数据技术:完成 Linux Shell 脚本学习并启动 Hadoop 安装。掌握 while 循环(用于日志文件逐行读取)与 case 语句(用于多条件分支判断),编写 “日志文件分析脚本”,成功统计某应用日志中 “ERROR”“WARN”“INFO” 级别的信息数量;随后学习 Hadoop 生态体系(HDFS、YARN、MapReduce 三大组件),了解三种安装模式的适用场景,在本地虚拟机(CentOS 7)上完成 Hadoop 伪分布式环境搭建,解决了 SSH 免秘钥登录失败(重新生成公钥并复制到 authorized_keys 文件)、HDFS 格式化后 NameNode 无法启动(删除 tmp 目录重新格式化)等问题,最终成功启动 HDFS 与 YARN 进程。
Python 语言:推进信息化热词收集与 pandas 基础学习。收集 “人工智能生成内容(AIGC)”“大数据中台”“低代码开发”“数字孪生” 等 20 个信息化热词,整理每个热词的领域(如 AI、大数据、软件开发)与核心定义;学习 pandas 库的 DataFrame 创建、数据读取(读取 Excel 热词表)、数据清洗(处理空值、重复值),完成热词数据的初步结构化存储,为后续分类分析奠定基础。
软件设计师备考:强化数据结构与软件工程知识。深入学习 “图” 的存储结构(邻接矩阵、邻接表)与遍历算法(深度优先、广度优先),通过画图分析与代码示例(Python 实现邻接表存储与遍历)加深理解;完成 30 道数据结构选择题(正确率提升至 75%)与 5 道算法设计填空题(重点练习排序算法应用);同时学习软件工程中的软件生命周期(需求分析、设计、编码、测试、维护),掌握需求分析文档(SRS)的核心要素,完成 1 份简单的 “学生管理系统” 需求分析框架编写。
二、本周遇到的问题
JAVA WEB 过滤器配置问题:在实现登录拦截过滤器时,配置 web.xml 后过滤器未生效,排查发现是过滤器映射的 URL 模式写错(将 “/*” 写成了 “/”),导致过滤器无法拦截所有请求;此外,未处理过滤器链的放行逻辑(忘记调用 chain.doFilter (request, response)),修正后成功实现 “未登录用户无法访问个人信息页” 的功能。
Hadoop 伪分布式环境搭建问题:在配置 core-site.xml、hdfs-site.xml 等配置文件时,因路径写错(将 “/home/hadoop/tmp” 写成 “home/hadoop/tmp”,缺少根目录 “/”),导致 HDFS 格式化失败;启动 YARN 后,ResourceManager 进程无法启动,查看日志发现是 yarn-site.xml 中 ResourceManager 地址配置错误,修改为正确的主机名后解决问题,整个环境搭建耗时约 3 小时。
软件设计师图算法理解困难:在学习图的广度优先遍历(BFS)时,对 “队列” 的辅助作用理解不透彻,尤其是如何通过队列记录待访问节点、避免重复访问,通过手动模拟 “无向图 BFS 遍历过程”(画出队列中节点的入队、出队顺序),才逐步掌握逻辑,但在做题时仍需较长时间分析,效率有待提升。
三、下周学习计划
JAVA WEB 技术:学习 SSH 框架(Struts2、Spring、Hibernate)基础,重点理解 Spring 的 IOC(控制反转)思想;完成 “图书管理系统” 的简单模块开发(图书查询、借阅记录展示),计划投入 7 小时学习,6 小时代码实践。
大数据技术:深入学习 HDFS 分布式文件系统,掌握 NameNode、DataNode、SecondaryNameNode 的作用,以及 HDFS 命令行操作(如创建目录、上传 / 下载文件、查看文件信息);完成 “HDFS 文件上传与下载” 实操案例,计划投入 8 小时学习,5 小时实操。
Python 语言:扩展热词库至 30 个,学习 pandas 的分组统计(按热词领域分组,统计各领域热词数量)与 matplotlib 库基础(绘制热词领域分布柱状图);开始撰写热词分类分析报告的框架,计划投入 6 小时学习,4 小时实践。
软件设计师备考:学习算法设计(动态规划、贪心算法)的核心思想,完成 20 道算法设计选择题;开始复习计算机网络知识(TCP/IP 协议栈、HTTP 协议),计划投入 7 小时学习,3 小时刷题。

posted @ 2025-09-02 22:48  落浅  阅读(5)  评论(0)    收藏  举报