102301332柯鸿斌的总结

柯鸿斌(102301332)- 总结报告

长路漫漫

一、学期回顾

回顾你对于软件工程课程的想象
在学期初,我认为软件工程主要关注开发过程的规范性和系统性。我期待通过这门课程学习如何在实际项目中应用工程化方法,掌握现代开发工具的使用技巧。

实际参与项目后,特别是在构建AI知识检索系统的过程中,我发现后端开发的内涵更加丰富。我认识到后端不仅是数据存储和业务逻辑处理,更是连接数据和智能应用的重要桥梁。如何将非结构化的游戏知识转化为可检索的语义向量,如何设计高效的混合检索策略,这些都是现代智能应用中后端开发的重要课题。

回顾你在这门课程中的投入与产出
我主要负责知识检索服务的研发工作,包括数据处理、索引构建、检索算法实现等。我大概写了600行Python数据处理脚本和800行Java检索服务代码。

软工实践各次作业花费的时间:

  • 第一次团队作业:4小时
  • 第二次团队作业:7小时
  • 第一次团队项目作业:12小时
  • 第二次团队项目作业:19小时
  • 第三次团队项目作业:24小时
  • 第四次团队项目作业:23小时

在软件工程课程上花费的时间:

  • 累计时间:89小时
  • 实际周均时间:8.9小时
  • 预计周均时间:7小时

令你印象最深刻的是哪一次作业或哪一场答辩?
最让我印象深刻的是发现单纯使用通用检索模型无法理解游戏专业术语的时候。刚开始我们使用通用的语义向量模型,结果发现对于“二楼”、“小黑屋”、“大招”这些游戏术语,模型完全无法准确理解,检索准确率只有50%左右。

我们团队讨论后决定,不能完全依赖通用模型,要结合游戏领域的专业知识。我们构建了领域知识增强的混合检索系统:一方面使用预训练模型进行语义检索,另一方面建立倒排索引和同义词词典进行关键词匹配,然后将两种结果融合排序。

经过这样的改造,专业术语的检索准确率提升到了85%以上。这件事让我深刻体会到,在特定的垂直领域,领域知识和工程技巧的结合往往比单纯追求技术复杂度更有效。

二、总结收获

展开说说你的软工实践故事
我的工作主要是将各种游戏知识——攻略、技能描述、地图点位信息等——转化为可智能检索的知识库。

第一步是数据处理。原始的游戏资料格式多样,有HTML、Markdown、文本等各种格式。我编写了一系列处理脚本,清洗数据、提取结构化信息、统一格式。这个过程虽然繁琐,但为后续的检索效果打下了基础。

接下来是向量化处理。我使用Sentence-BERT模型将文本转换成语义向量,然后存入Milvus向量数据库。这样系统就可以通过计算向量相似度来找到语义上相关的内容。

最让我有挑战性的是处理一词多义的问题。比如“大招”这个词,在不同英雄那里指代的是不同的技能。我通过实体链接技术,将词条与具体的英雄关联起来,解决了歧义问题。

当看到检索系统能够准确回答“Bind地图A点怎么进攻”这样的具体问题时,我觉得所有的技术选型和工程实现都是值得的。

介绍学习到的新技术或生产力工具以及它们给你带来了哪方面的帮助?

  • 向量数据库:掌握了Milvus向量数据库的部署和应用,能够实现高效的语义相似度检索。
  • 语义检索技术:学会了使用Sentence-BERT等模型进行文本向量化处理。
  • 混合检索策略:理解了如何结合语义检索和关键词检索的优势,提升整体检索效果。
  • 数据处理技能:熟练掌握了Pandas、BeautifulSoup等工具,能够处理各种格式的原始数据。

这些技术不仅让我完成了项目任务,更重要的是让我对现代检索技术有了系统的认识。我现在会更加注重技术方案的实用性和效果导向。

技术之外,这门课程还给你带来了哪些方面的提升?

  • 技术选型能力:学会了根据具体的业务场景选择合适的技术方案,而不是一味追求技术复杂度。
  • 领域理解能力:为了更好地设计检索系统,我深入学习了《无畏契约》的游戏机制和玩家需求,这对做好技术工作很有帮助。
  • 效果评估思维:养成了以实际效果为导向的开发习惯,会持续关注和优化系统的检索效果。
  • 工程实现能力:学会了如何将算法模型转化为稳定可靠的服务系统。

如果还有什么想记录的或者想说的,就写在这儿吧!
回顾整个项目过程,我觉得最大的收获是理解了智能检索系统的完整构建流程。以前我对AI应用的理解比较表面,现在我知道要构建一个实用的智能系统,需要在数据处理、模型选型、工程实现等多个环节下功夫。

最让我开心的是看到自己构建的检索系统能够真正帮到玩家。当用户通过我们的系统快速找到需要的战术信息时,我觉得自己的工作很有价值。

有时候我也会想,如果时间更充裕,我可能会在个性化推荐方面做得更多,比如根据玩家的游戏习惯推荐适合的战术。但考虑到项目周期和优先级,我们做出了合适的选择。

通过这次实践,我不仅提升了技术水平,更重要的是学会了如何将AI技术落地为实际可用的产品功能。这种工程化思维对我未来的发展会有很大帮助。

三、致谢
感谢数据组提供了高质量的结构化数据,这是我们检索系统的基础。感谢前端团队设计了清晰友好的问答界面,让用户能够方便地使用我们的服务。最要感谢的就是我们的项目经理,帮助了我很多很多

posted @ 2025-12-28 19:06  kyyyy  阅读(1)  评论(0)    收藏  举报