个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!
各位老师好,我是XX同学,我的题目是《基于Hadoop的企业信息管理系统》。系统把公司日常档案、员工信息、文件流转全部搬到网页上,后台用HDFS做分布式存文件,MapReduce做批量统计,Hive做快速查数,YARN管资源,前端就是HTML+JS+Bootstrap,一键上传、一键检索、一键备份,目标是让公司再也不用U盘拷资料。
——陈述完毕,请各位老师批评指正!
评委老师:为什么选择Hadoop,而不用大家更熟悉的MySQL?
答辩学生:MySQL放几千万条记录还行,但我们要存扫描件、合同扫描版PDF,一个文件几十兆,总量很快就上TB。HDFS可以把大档案切块、做多副本,还能加廉价硬盘扩容,公司预算只有两台旧台式机,MySQL扛不住,Hadoop刚好能跑。
评委老师:框架到底给谁用?需要登录吗?
答辩学生:给行政、人事、财务三个人员角色用,登录页分权限:行政能看全部,人事只看员工模块,财务只看合同付款。账号密码存在MySQL,但记录实体只进HDFS,不混一起。
评委老师:文件存进HDFS后,怎么保证误删还能找回?
答辩学生:HDFS默认3副本,我另外写了一个每天凌晨的Shell脚本,把重要目录再做一次快照,放到/export/backup,保留7天,误删就回滚快照。
评委老师:小文件太多会不会把NameNode内存撑爆?
答辩学生:会,所以我用Har归档,把一天内上传的小于10M的文件打成har包,包名带日期,这样NameNode只记一个逻辑文件,内存压力就降下来了。
评委老师:MapReduce你用来算什么?
答辩学生:目前只算两个指标:①每月上传文件总量,②各部门文件占比。以后想加“关键词热度”再扩展,先跑通流程。
评委老师:前端页面你自己写的吗?用了什么框架?
Hive的HQL接口,返回JSON填到表格。就是答辩学生:自己写的,只用Bootstrap,没敢用Vue,怕毕设来不及。页面五个菜单:上传、列表、搜索、统计、个人中心,搜索调的
评委老师:如果以后公司要加视频培训资料,还能直接用这套平台吗?
答辩学生:可以,HDFS单文件支持GB级,我把上传限制改大就行,但视频不做副本冗余,改让运维定期拷到移动硬盘,节省集群空间。
评委老师:最终一句,按计划你现在应该做到哪一步?
答辩学生:按2025年进度,现在应完成环境搭建+Har打包脚本,四月做前端联调,五月写论文,今天回去就把NameNode内存监控图补出来。
评委老师评价:
XX同学选题贴近中小公司实际,技术路线清晰,知道用Har克服小文件痛点,也意识到副本与快照的区别,基础虽一般但讲得朴实。建议下一步把“搜索响应时间”和“节点宕机恢复”两个实验数据补齐,论文里加截图,就能达到毕业要求。总体予以通过,加油!
以上是某同学的毕业设计答辩的过程,要是你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取
最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系大家进行帮你选题、定功能和建议。