[T.12] 团队项目:Scider Alpha 阶段发布说明
| 这个作业属于哪个课程 | 北航2026年春季软件工程 |
|---|---|
| 这个作业的要求在哪里 | [T.12] 团队项目:Alpha 阶段发布说明 |
| 我在这个课程的目标是 | 体验完整软件开发流程,交付一款真正解决科研阅读痛点的软件产品 |
| 这个作业在哪个具体方面帮助我实现目标 | 完成 Alpha 阶段发布说明 |
Scider 是一个智能学术论文管理辅助平台,面向科研人员与学生,提供论文检索、AI 解析、知识图谱可视化与个人文库管理等功能。
首个 Alpha 版本现已上线,所有核心功能均可免费使用,期待您的使用反馈!
在线体验:http://39.107.252.200
用户反馈问卷:https://v.wjx.cn/vm/tkW5WW2.aspx
1.新功能和特性
1.1 用户认证与个人信息管理
实现需求
构建安全的用户账户体系,作为所有功能的使用入口:
- 邮箱 + 密码方式注册与登录,密码长度不少于 6 位
- 基于 JWT 的身份认证机制,保障会话安全
- 登录后自动维护会话状态,无需频繁重复登录
- 支持查看用户名、邮箱、用户 ID 等基本信息
应用场景
研一新生张同学的导师给他布置了文献调研任务。他注册并登录 Scider 后,系统持续保持登录状态。此后数周,他每天打开浏览器即进入自己的文献空间,之前未读完的论文和“待确认”的解析结果均保留在原位,继续操作即可。个人文库的私密性确保只有他自己能够访问和管理这些内容。
1.2 智能 PDF 解析与四要素提取
实现需求
- 支持将本地pdf论文文件上传到文库,AI自动解析文本
- 上传 PDF 论文后,系统在后台异步完成全文解析,并调用大模型自动提取四项核心要素:
- 研究背景:论文要解决什么问题
- 研究方法:采用了什么技术手段
- 创新点:相比已有工作有何突破
- 研究结论:得出了什么重要发现
- 解析过程实时显示进度状态,支持 MD5 去重检测,避免重复上传同一论文
- 支持手动编辑完善论文四要素,形成自己的理解笔记;确认后论文状态改变为“已确认”,即可加入知识图谱体系
- 支持跳转到论文预览界面
应用场景
张同学上传导师推荐的论文,由系统在后台逐一解析,进度条显示完成情况。约十分钟后,页面显示多篇论文处于“待确认”状态。他点开一篇关于 Transformer 的论文,看到系统已提取出四要素信息。他对提取结果做了两处微调后点击确认。通过这一方式,他在一周内完成了三十余篇论文的核心信息提取,形成对研究方向的整体认识。
1.3 文库管理
实现需求
提供灵活的论文组织管理功能,作为用户管理个人文献库的核心界面:
- 支持创建、重命名、删除文件夹
- 支持在当前文件夹内快速按标题或作者搜索定位论文
- 支持对论文的批量复制、删除操作
应用场景
张同学将论文上传到平台后,他在文库模块创建了“综述打底”“经典方法”“最新进展”三个文件夹,并将已解析完成的论文分类放入不同文件夹。通过文件夹筛选和标题搜索,他能够随时定位到目标论文。
1.4 论文发现与检索系统
实现需求
提供三种检索方式,帮助用户寻找新论文:
- 方向推荐:基于用户文库中已收藏的论文,自动推荐研究方向相近的文献
- 关键词检索:按标题、作者、摘要关键词进行多维度搜索;支持按年份范围、来源类型、相关性过滤
- 上下游检索:以已入库的某一篇论文为起点,查看其参考文献(上游脉络)与被引用情况(下游脉络),一键构建学术脉络
- 对于检索到的文献,支持查看摘要并跳转到来源网址
应用场景
张同学在浏览已入库论文后,使用进入发现论文模块,系统根据其文库论文推送了十几篇高度相关的近期文献。接着,他选择文库中一篇核心论文进行“上下游检索”,界面生成学术脉络树,分别展示了该论文引用的上游文献和引用它的下游文献。依据这个脉络,他在撰写文献综述时,梳理了清晰的研究传承关系。
1.5 知识图谱可视化
实现需求
基于“我的文库”中已确认的论文集合,自动生成个人学术知识网络的可视化呈现:
- 以力导向图形态展示论文间的语义关联,连线表示从属、语义相似等关系,相似论文自动聚集成研究簇,
- 语义相似度计算基于通义千问 Embedding 模型(1536 维语义向量)
- 支持拖拽节点调整布局、缩放查看全局或局部、选择四要素子节点的显示状态
- 支持按文件夹筛选载入范围,仅已确认状态的论文参与图谱构建
- 点击任意节点可弹出侧边栏,查看论文基本信息、关键词摘要预览及关联节点列表等信息,并支持跳转至论文预览界面
应用场景
经过数周的文献积累,张同学的文库中已有超过五十篇确认论文。为准备向导师汇报调研进展,他启用知识图谱功能,将所有论文生成为一张知识网络。图中自动聚出几个主要研究簇,几篇横跨多簇的论文以连线表示交叉关系。汇报时,张同学通过拖拽节点,向导师展示了各方向的关联性以及两个可能的研究空白点,并据此梳理了开题思路。
1.6 论文预览与笔记
实现需求
在论文预览界面提供集成化的阅读与批注环境,将原文浏览和笔记记录无缝衔接:
- 直接渲染 PDF 原文,支持连续滚动阅读、页码跳转和缩放
- 为每篇论文添加文本笔记,记录阅读过程中的思考、疑问和总结;所有笔记修改即时自动保存,无需手动提交
应用场景
张同学锁定一篇需要进行精读的论文后,在 Scider 中直接打开 PDF 预览。页面左侧显示原文,右侧为笔记面板。阅读过程中,他在笔记栏记录了创新点的比较、对实验数据集划分的疑问等内容,笔记被自动保存,可供后续引用和复现时查阅。
运行环境
本平台 Alpha 阶段为 Web 应用,用户无需安装任何客户端软件,通过浏览器即可访问全部功能。
运行环境
| 操作系统 | 浏览器及版本 |
|---|---|
| macOS 14+ | Chrome 120+、Safari 17+、Firefox 120+、Edge 120+ |
| Windows 10/11 | Chrome 120+、Firefox 120+、Edge 120+ |
最低运行要求
- 浏览器需启用 JavaScript
- 屏幕分辨率不低于 1366×768(推荐 1920×1080)
- 需要能够正常访问以下域名:
- api.semanticscholar.org(论文检索)
- dashscope.aliyuncs.com(阿里云通义千问 API)
移动端适配说明
Alpha 阶段尚未完成移动端适配。在屏幕宽度小于 768px 的设备上访问,页面布局可能出现错位,PDF 预览的缩放与翻页操作体验欠佳。建议使用平板或桌面设备进行详细论文阅读。
安装与使用方法
访问方式
本软件为 Web 应用,无需安装。直接在浏览器地址栏输入 http://39.107.252.200 即可访问。
注册方式
平台支持用户自行注册:
- 访问首页,点击右上角“注册”按钮
- 填写邮箱地址和密码(密码不少于 6 位)
- 点击“注册”完成账号创建
新用户入门流程
- 注册登录:使用邮箱和密码注册账号并登录系统
- 建立文库:进入“我的文库”,创建文件夹搭建个人文献分类结构
- 上传论文:点击“上传 PDF”按钮,选择或拖拽 PDF 文件,等待后台解析(通常在 1 分钟以内)
- 确认关键词:解析完成后点击论文卡片,在抽屉中查看并确认 AI 提取的四要素内容
- 发现新论文:进入“发现论文”栏目,通过关键词检索获取更多文献
- 探索知识图谱:上传 3 篇以上并确认状态的论文后,进入“知识图谱”页面,选择文件夹生成图谱并交互探索
进阶功能
- 上下游检索:在“发现论文”页面,选择已入库的论文查看其参考文献与引用文献
- 添加笔记:在论文预览界面中点击“笔记”标签,即可记录阅读思考
系统已知的问题和限制
已知问题
- AI 四要素提取解析延迟
- 表现:论文提交解析后,在队列繁忙时可能需要等待 3-10 分钟才能完成四要素提取
- 触发条件:后台任务队列中存在大量待处理任务,或通义千问 API 响应较慢
- 预计修复:Beta 版本优化任务调度机制与队列优先级
- 知识图谱节点过多时渲染卡顿
- 表现:节点数超过 150 个时,拖拽、缩放操作出现明显延迟;此时也难以查看语义关联信息
- 触发条件:选择包含大量论文的文件夹生成图谱
- 预计修复:Beta 版本引入渲染优化
- 知识图谱语义关联算法有待完善
- 表现:当前图谱完全基于 Embedding 向量相似度构建,仅能量化论文间的距离远近,无法说明具体的语义关联理由;同时,在部分领域纯相似度计算的聚类精度偏低
- 触发条件:论文涉及跨学科内容,或文本较短、摘要信息不足
- 预计修复:后续版本计划引入大语言模型直接生成论文间的语义关联图谱,替代当前纯 Embedding 相似度方案,以提升关联的可解释性与准确度
- Semantic Scholar API 偶发限流
- 表现:短时间内大量搜索后可能返回 429 错误(Too Many Requests)
- 触发条件:短时间内发起多次搜索请求
- 预计修复:Beta 版本计划增加本地缓存机制
- AI 四要素提取解析偶有偏差
- 表现:部分论文的 AI 提取内容存在不准确或信息不完整的情况
- 触发条件:论文格式不规范(如双栏排版、扫描件)或内容高度专业化
- 预计修复:持续优化 Prompt 工程与模型选择
功能限制
- 单文件上传上限 50MB:超大型综述论文或包含大量高清图表的论文,建议先使用压缩工具处理后上传
- Embedding 模型固定:当前仅支持阿里云通义千问 text-embedding-v1,暂不支持切换至 OpenAI 或 HuggingFace 等其他 Embedding 服务
- 离线模式不可用:论文搜索、AI 解析、知识图谱等核心功能依赖外部 API,无网络环境下仅可查看已上传的论文和笔记
- 数据导出未实现:暂不支持批量导出论文元数据或笔记,Beta 版本将加入导出功能
- 仅支持单级文件夹操作:目前文件夹不支持嵌套子文件夹,Beta 版本计划支持多级嵌套文件夹
- 仅支持一篇txt笔记:目前不支持多篇笔记记录,Beta版本计划优化笔记系统
软件发布方式与发布地址
在线体验
直接在浏览器中访问 http://39.107.252.200 即可使用全部功能,无需安装任何软件。
开源仓库
Scider 完全开源,可通过 GitHub 获取源码并自行部署:
git clone https://github.com/XiaCang/Scider.git

浙公网安备 33010602011771号