第二周学习进度总结报告

一、本周学习情况
本周延续了第一周的学习节奏，围绕 JAVA WEB、大数据技术、Python 及软件设计师备考四大模块推进，学习状态更稳定，累计投入学习时间 32 小时，其中代码实践 19 小时，问题解决时间 5 小时，知识点梳理与资料整合 8 小时。
JAVA WEB 技术：聚焦 SERVLET 核心功能与 JSP 内置对象。深入学习请求转发（RequestDispatcher）与重定向（sendRedirect）的区别，通过 “用户注册后跳转至登录页” 案例，明确前者服务器内跳转、后者客户端跳转的逻辑差异；完成 “用户注册 - 登录 - 个人信息展示” 完整流程开发，涉及表单数据验证（非空、格式校验）、session 会话存储用户状态，解决了 “登录后直接访问个人信息页未拦截” 的问题（通过过滤器 Filter 实现登录校验）。同时，掌握 JSP 内置对象 request、response、session 的常用方法，例如通过 request 获取表单参数、通过 session 存储用户登录状态，累计编写代码约 800 行。
大数据技术：完成 Linux Shell 脚本学习并启动 Hadoop 安装。掌握 while 循环（用于日志文件逐行读取）与 case 语句（用于多条件分支判断），编写 “日志文件分析脚本”，成功统计某应用日志中 “ERROR”“WARN”“INFO” 级别的信息数量；随后学习 Hadoop 生态体系（HDFS、YARN、MapReduce 三大组件），了解三种安装模式的适用场景，在本地虚拟机（CentOS 7）上完成 Hadoop 伪分布式环境搭建，解决了 SSH 免秘钥登录失败（重新生成公钥并复制到 authorized_keys 文件）、HDFS 格式化后 NameNode 无法启动（删除 tmp 目录重新格式化）等问题，最终成功启动 HDFS 与 YARN 进程。
Python 语言：推进信息化热词收集与 pandas 基础学习。收集 “人工智能生成内容（AIGC）”“大数据中台”“低代码开发”“数字孪生” 等 20 个信息化热词，整理每个热词的领域（如 AI、大数据、软件开发）与核心定义；学习 pandas 库的 DataFrame 创建、数据读取（读取 Excel 热词表）、数据清洗（处理空值、重复值），完成热词数据的初步结构化存储，为后续分类分析奠定基础。
软件设计师备考：强化数据结构与软件工程知识。深入学习 “图” 的存储结构（邻接矩阵、邻接表）与遍历算法（深度优先、广度优先），通过画图分析与代码示例（Python 实现邻接表存储与遍历）加深理解；完成 30 道数据结构选择题（正确率提升至 75%）与 5 道算法设计填空题（重点练习排序算法应用）；同时学习软件工程中的软件生命周期（需求分析、设计、编码、测试、维护），掌握需求分析文档（SRS）的核心要素，完成 1 份简单的 “学生管理系统” 需求分析框架编写。
二、本周遇到的问题
JAVA WEB 过滤器配置问题：在实现登录拦截过滤器时，配置 web.xml 后过滤器未生效，排查发现是过滤器映射的 URL 模式写错（将 “/*” 写成了 “/”），导致过滤器无法拦截所有请求；此外，未处理过滤器链的放行逻辑（忘记调用 chain.doFilter (request, response)），修正后成功实现 “未登录用户无法访问个人信息页” 的功能。
Hadoop 伪分布式环境搭建问题：在配置 core-site.xml、hdfs-site.xml 等配置文件时，因路径写错（将 “/home/hadoop/tmp” 写成 “home/hadoop/tmp”，缺少根目录 “/”），导致 HDFS 格式化失败；启动 YARN 后，ResourceManager 进程无法启动，查看日志发现是 yarn-site.xml 中 ResourceManager 地址配置错误，修改为正确的主机名后解决问题，整个环境搭建耗时约 3 小时。
软件设计师图算法理解困难：在学习图的广度优先遍历（BFS）时，对 “队列” 的辅助作用理解不透彻，尤其是如何通过队列记录待访问节点、避免重复访问，通过手动模拟 “无向图 BFS 遍历过程”（画出队列中节点的入队、出队顺序），才逐步掌握逻辑，但在做题时仍需较长时间分析，效率有待提升。
三、下周学习计划
JAVA WEB 技术：学习 SSH 框架（Struts2、Spring、Hibernate）基础，重点理解 Spring 的 IOC（控制反转）思想；完成 “图书管理系统” 的简单模块开发（图书查询、借阅记录展示），计划投入 7 小时学习，6 小时代码实践。
大数据技术：深入学习 HDFS 分布式文件系统，掌握 NameNode、DataNode、SecondaryNameNode 的作用，以及 HDFS 命令行操作（如创建目录、上传 / 下载文件、查看文件信息）；完成 “HDFS 文件上传与下载” 实操案例，计划投入 8 小时学习，5 小时实操。
Python 语言：扩展热词库至 30 个，学习 pandas 的分组统计（按热词领域分组，统计各领域热词数量）与 matplotlib 库基础（绘制热词领域分布柱状图）；开始撰写热词分类分析报告的框架，计划投入 6 小时学习，4 小时实践。
软件设计师备考：学习算法设计（动态规划、贪心算法）的核心思想，完成 20 道算法设计选择题；开始复习计算机网络知识（TCP/IP 协议栈、HTTP 协议），计划投入 7 小时学习，3 小时刷题。

posted @ 2025-09-02 22:48 落浅阅读(7) 评论(0) 收藏举报

刷新页面返回顶部

hy-tes

第二周学习进度总结报告

公告