【开题答辩全过程】以 hadoop企业信息管理系统为例，包含答辩的问题和答案 - 实践

个人简介
一名14年经验的资深毕设内行人，语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持！

各位老师好，我是XX同学，我的题目是《基于Hadoop的企业信息管理系统》。系统把公司日常档案、员工信息、文件流转全部搬到网页上，后台用HDFS做分布式存文件，MapReduce做批量统计，Hive做快速查数，YARN管资源，前端就是HTML+JS+Bootstrap，一键上传、一键检索、一键备份，目标是让公司再也不用U盘拷资料。

——陈述完毕，请各位老师批评指正！

评委老师：为什么选择Hadoop，而不用大家更熟悉的MySQL？
答辩学生：MySQL放几千万条记录还行，但我们要存扫描件、合同扫描版PDF，一个文件几十兆，总量很快就上TB。HDFS可以把大档案切块、做多副本，还能加廉价硬盘扩容，公司预算只有两台旧台式机，MySQL扛不住，Hadoop刚好能跑。

评委老师：框架到底给谁用？需要登录吗？
答辩学生：给行政、人事、财务三个人员角色用，登录页分权限：行政能看全部，人事只看员工模块，财务只看合同付款。账号密码存在MySQL，但记录实体只进HDFS，不混一起。

评委老师：文件存进HDFS后，怎么保证误删还能找回？
答辩学生：HDFS默认3副本，我另外写了一个每天凌晨的Shell脚本，把重要目录再做一次快照，放到/export/backup，保留7天，误删就回滚快照。

评委老师：小文件太多会不会把NameNode内存撑爆？
答辩学生：会，所以我用Har归档，把一天内上传的小于10M的文件打成har包，包名带日期，这样NameNode只记一个逻辑文件，内存压力就降下来了。

评委老师：MapReduce你用来算什么？
答辩学生：目前只算两个指标：①每月上传文件总量，②各部门文件占比。以后想加“关键词热度”再扩展，先跑通流程。

评委老师：前端页面你自己写的吗？用了什么框架？
Hive的HQL接口，返回JSON填到表格。就是答辩学生：自己写的，只用Bootstrap，没敢用Vue，怕毕设来不及。页面五个菜单：上传、列表、搜索、统计、个人中心，搜索调的

评委老师：如果以后公司要加视频培训资料，还能直接用这套平台吗？
答辩学生：可以，HDFS单文件支持GB级，我把上传限制改大就行，但视频不做副本冗余，改让运维定期拷到移动硬盘，节省集群空间。

评委老师：最终一句，按计划你现在应该做到哪一步？
答辩学生：按2025年进度，现在应完成环境搭建+Har打包脚本，四月做前端联调，五月写论文，今天回去就把NameNode内存监控图补出来。

评委老师评价：
XX同学选题贴近中小公司实际，技术路线清晰，知道用Har克服小文件痛点，也意识到副本与快照的区别，基础虽一般但讲得朴实。建议下一步把“搜索响应时间”和“节点宕机恢复”两个实验数据补齐，论文里加截图，就能达到毕业要求。总体予以通过，加油！

以上是某同学的毕业设计答辩的过程，要是你现在还没有参加答辩，还是开题阶段，已经选好了题目不知道怎么写开题报告，可以下面找找有没有自己符合自己题目的开题报告内容，列表中的开题报告都是往届真实的开题报告，可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学，建议自己多花时间找一下资料（开题报告、源码）自己独立完成毕设，需要开题报告内容、源码参考的，可以联xi博主，没有选题的也可以联系大家进行帮你选题、定功能和建议。

posted @ 2025-09-19 08:13 ycfenxi 阅读(6) 评论(0) 收藏举报

刷新页面返回顶部

【开题答辩全过程】以 hadoop企业信息管理系统为例，包含答辩的问题和答案 - 实践

最后

公告