[T.4] 团队项目:选题和需求分析
| 这个作业属于哪个课程 | 北航2026年春季软件工程 |
|---|---|
| 这个作业的要求在哪里 | [T.4] 团队项目:选题和需求分析 |
| 我在这个课程的目标是 | 体验完整软件开发流程,交付一款真正解决科研阅读痛点的软件产品 |
| 这个作业在哪个具体方面帮助我实现目标 | 通过NABCD模型和竞品分析,明确产品定位、核心价值与技术路径 |
一、 选题介绍:Scider
logo由团队成员肖清心使用ps设计绘制
Scider是一款旨在帮助科研新手——尤其是本科生和低年级研究生——高效阅读、深度理解并系统性管理学术论文的智能辅助平台。
在经历了初期的选题探索后,我们选择移除了游戏化、角色扮演等元素,将产品核心聚焦于科研阅读中最根本的两个痛点:
- “读后即忘,难以形成知识体系”:论文读了不少,但脑中依旧碎片化,无法将不同研究的观点和方法联系起来。
- “面对海量文献,不知从何读起”:明确了研究方向,却不清楚该领域的必读经典和最新进展,文献追踪效率低下。
Scider 的核心逻辑是 “阅读 → 提炼 → 关联 → 推荐”。它通过AI自动提取论文的侧重点(Paper Key Points),结合用户的人工修订,为每一篇论文打上精准的“知识标签”,并以此为基础,构建可视化的个人论文知识图谱。基于这张图谱,系统能够智能推荐研究方向相关的新论文,并一键检索已读论文的参考文献(上游)和后续引用(下游),帮助用户理清学术脉络。
二、 NABCD 模型分析
N (Need)
作为刚刚踏入科研领域的本科生或研究生,我们自身及身边的同学普遍面临以下困境:
- 知识碎片化,难以内化:读完一篇论文,两周后便忘了其核心创新点,更无法将不同论文的观点联系起来。读文献像“狗熊掰棒子”,缺乏系统性的知识沉淀。
- 文献追踪效率低:导师给了方向,却不知该领域必读的经典文献是哪些、最新的前沿进展又如何。寻找一篇论文的参考文献和后续引用,往往需要在多个学术搜索引擎间反复横跳。
- 阅读门槛高:英文论文行文晦涩,提炼核心论点耗时极长,初学者容易在细节中迷失方向。
现有工具如 Zotero 解决了文献管理问题,但未解决“内容理解与关联”问题;ChatPDF 解决了单篇问答,但未解决“知识体系构建与宏观推荐”问题。
A (Approach)
我们提供了一套从“阅读输入”到“知识输出”的闭环方案,涵盖以下三大核心模块:
1. 论文知识图谱模块
- AI 提取 Paper Key Points:用户上传 PDF 后,系统利用大语言模型自动解析全文,提取论文的侧重点(研究背景、方法、创新点、结论)。后台采用异步处理机制,避免阻塞用户操作,并实时反馈任务进度。
- 人工修订与确认:系统将 AI 提取的结构化信息以表单形式展示,用户可对其进行审核、编辑与确认。这一设计不仅修正了 AI 可能的幻觉,更通过“亲手整理”的动作加深了用户对论文的理解和记忆。
- 知识图谱可视化:基于用户确认的多篇论文 Key Points,系统通过关键词共现或语义相似度算法,自动分析论文间的共性与联系,生成可视化的力导向图。用户可直观地看到论文、概念与方法之间的关联网络,并支持拖拽、缩放等流畅交互。
2. 智能推荐模块
- 研究方向推荐:用户只需输入研究方向(如“基于Transformer的时序预测”),系统即对接 arXiv 或 Semantic Scholar API 推荐该领域的新论文,解决“不知道读什么”的难题。
- 上下游论文检索:针对库内任一论文,系统通过 DOI 或标题向学术数据库发起查询,一键检索并分类展示其参考文献(上游)和引用文献(下游),帮助用户快速理清学术传承脉络。
3. 论文管理模块
- 上传与解析:支持 PDF 上传,系统自动提取标题、作者、摘要等元数据及全文文本。
- 文库管理:提供列表视图,支持标签标记、文件夹分类及关键词检索,确保论文库井然有序。
B (Benefit)
Scider 的核心价值在于帮助科研新手将散落的论文转化为互相关联、可生长的个人知识网络:
- 通过 AI 自动提取并人工确认的 Paper Key Points,用户能够快速抓住论文骨架、加深理解记忆,告别“读后即忘”
- 基于已确认知识节点自动生成的可视化知识图谱,让原本孤立的论文以主题、方法为线索串联成网,直观呈现领域整体脉络
- 同时,智能方向推荐与一键上下游检索大幅节省文献调研时间,而结构化的预提炼阅读方式则降低了英文论文的入门门槛,使用户得以带着清晰框架高效阅读
C (Competitors)
我们对四款主要竞品进行了深入分析:
| 竞品 | 核心定位 | 主要功能 | Scider 的差异化优势 |
|---|---|---|---|
| Zotero / Mendeley | 文献管理工具 | 文献收集、引用格式管理、PDF标注、云同步 | 知识图谱化:Zotero 管理的是文件元数据,Scider 管理的是论文内部的“知识节点”及其“关联”。前者回答“我有多少论文”,后者回答“这些论文在讲什么、它们有何联系”。 |
| ChatPDF | 单篇论文AI对话 | 上传PDF,即时问答,定位原文出处 | 系统性构建:ChatPDF 是离散的问答,用完即走;Scider 是跨论文的、结构化的知识网络构建。我们不仅解答单篇疑问,更帮助用户将多篇论文的知识点串联成网。 |
| ReadPaper | 专业科研全流程平台 | AI辅读、划词翻译、文献管理、学术社区、知识图谱(引用网络) | 轻量化与个人化:ReadPaper 功能大而全,目标用户是专业科研人员,学习成本高;Scider 更轻量,聚焦于个人知识图谱的构建与智能推荐,更适合科研入门者。且 ReadPaper 的知识图谱偏向于宏观的引用关系,我们侧重于论文内容语义层面的知识关联。 |
| 切问学术 (Qiewen) | AI科研智能体 (AI Agent) | 智能检索(3.6亿论文库)、论文精读翻译、知识库对话、自动化实验、论文写作辅助 | 定位差异:学习助手 vs. 科研自动驾驶 切问学术致力于成为科研的“自动驾驶系统”,接管从检索、阅读、实验到写作的全流程,目标用户是高负荷的硕博及科研人员。Scider 则专注于阅读与理解这一单一环节,目标是帮助科研新手降低门槛、构建知识体系,扮演的是“思维脚手架”角色。 资源差异:切问背靠强大的自有数据库和算力,Scider 作为课程项目依赖外部 API,但我们通过 AI提取+人工修订 的闭环,确保知识的准确性与个人化。 |
D (Delivery)
- 发布平台:Web 端
- 推广策略:
- 校园内测:在北航校内进行小范围内测,收集反馈并迭代。
- 内容营销:在知乎、小红书发布“如何利用AI构建个人知识库”、“研一如何高效阅读文献”等经验贴,附带工具引流。
- 开源社区:将项目核心技术在 GitHub 开源,吸引技术爱好者和开发者贡献。
二、技术实现与挑战
技术栈
- 后端:Python (Flask)
- 前端:Vue 3
- 数据库:PostgreSQL
- 关键依赖:LLM API、学术数据库 API(Semantic Scholar / arXiv)
核心功能实现要点
- LLM 提取的准确性:设计稳定的 Prompt 工程,确保不同格式、不同领域的论文都能提取出结构化的 Key Points(研究目标、方法、创新点、结论)。
- 图谱关系的挖掘算法:初期基于关键词共现和简单的 NLP 相似度匹配,后续考虑引入更复杂的图嵌入技术。
- 上下游论文数据源:对接 Semantic Scholar 或 arXiv API,处理 API 限流及数据不全的问题,并提供超时控制机制。
非功能性需求与挑战
- 性能与效率:PDF 解析与 AI 提取为耗时操作,必须采用异步任务队列处理,并向用户提供明确的进度反馈。知识图谱渲染需优化以支持数十节点的流畅展示。
- 界面设计:采用左侧导航与右侧内容区的经典布局,知识图谱页面采用全屏画布设计以提供沉浸式交互体验。
- 数据安全与可扩展性:用户论文文件为私有资产,需确保存储安全与访问控制。图谱关系定义与推荐算法采用模块化设计,便于未来升级更复杂的语义分析与个性化推荐模型。
AIGC声明:数据搜集整理借助了deepseek-chat

浙公网安备 33010602011771号