[T.12] 团队项目:Scider Alpha 阶段发布说明

这个作业属于哪个课程 北航2026年春季软件工程
这个作业的要求在哪里 [T.12] 团队项目:Alpha 阶段发布说明
我在这个课程的目标是 体验完整软件开发流程,交付一款真正解决科研阅读痛点的软件产品
这个作业在哪个具体方面帮助我实现目标 完成 Alpha 阶段发布说明

Scider 是一个智能学术论文管理辅助平台,面向科研人员与学生,提供论文检索、AI 解析、知识图谱可视化与个人文库管理等功能。

首个 Alpha 版本现已上线,所有核心功能均可免费使用,期待您的使用反馈!

在线体验http://39.107.252.200
用户反馈问卷https://v.wjx.cn/vm/tkW5WW2.aspx

1.新功能和特性

1.1 用户认证与个人信息管理

实现需求

构建安全的用户账户体系,作为所有功能的使用入口:

  • 邮箱 + 密码方式注册与登录,密码长度不少于 6 位
  • 基于 JWT 的身份认证机制,保障会话安全
  • 登录后自动维护会话状态,无需频繁重复登录
  • 支持查看用户名、邮箱、用户 ID 等基本信息

应用场景

研一新生张同学的导师给他布置了文献调研任务。他注册并登录 Scider 后,系统持续保持登录状态。此后数周,他每天打开浏览器即进入自己的文献空间,之前未读完的论文和“待确认”的解析结果均保留在原位,继续操作即可。个人文库的私密性确保只有他自己能够访问和管理这些内容。

1.2 智能 PDF 解析与四要素提取

实现需求

  • 支持将本地pdf论文文件上传到文库,AI自动解析文本
  • 上传 PDF 论文后,系统在后台异步完成全文解析,并调用大模型自动提取四项核心要素:
    • 研究背景:论文要解决什么问题
    • 研究方法:采用了什么技术手段
    • 创新点:相比已有工作有何突破
    • 研究结论:得出了什么重要发现
  • 解析过程实时显示进度状态,支持 MD5 去重检测,避免重复上传同一论文
  • 支持手动编辑完善论文四要素,形成自己的理解笔记;确认后论文状态改变为“已确认”,即可加入知识图谱体系
  • 支持跳转到论文预览界面

应用场景

张同学上传导师推荐的论文,由系统在后台逐一解析,进度条显示完成情况。约十分钟后,页面显示多篇论文处于“待确认”状态。他点开一篇关于 Transformer 的论文,看到系统已提取出四要素信息。他对提取结果做了两处微调后点击确认。通过这一方式,他在一周内完成了三十余篇论文的核心信息提取,形成对研究方向的整体认识。

1.3 文库管理

实现需求

提供灵活的论文组织管理功能,作为用户管理个人文献库的核心界面:

  • 支持创建、重命名、删除文件夹
  • 支持在当前文件夹内快速按标题或作者搜索定位论文
  • 支持对论文的批量复制、删除操作

应用场景

张同学将论文上传到平台后,他在文库模块创建了“综述打底”“经典方法”“最新进展”三个文件夹,并将已解析完成的论文分类放入不同文件夹。通过文件夹筛选和标题搜索,他能够随时定位到目标论文。

1.4 论文发现与检索系统

实现需求

提供三种检索方式,帮助用户寻找新论文:

  • 方向推荐:基于用户文库中已收藏的论文,自动推荐研究方向相近的文献
  • 关键词检索:按标题、作者、摘要关键词进行多维度搜索;支持按年份范围、来源类型、相关性过滤
  • 上下游检索:以已入库的某一篇论文为起点,查看其参考文献(上游脉络)与被引用情况(下游脉络),一键构建学术脉络
  • 对于检索到的文献,支持查看摘要并跳转到来源网址

应用场景

张同学在浏览已入库论文后,使用进入发现论文模块,系统根据其文库论文推送了十几篇高度相关的近期文献。接着,他选择文库中一篇核心论文进行“上下游检索”,界面生成学术脉络树,分别展示了该论文引用的上游文献和引用它的下游文献。依据这个脉络,他在撰写文献综述时,梳理了清晰的研究传承关系。

1.5 知识图谱可视化

实现需求

基于“我的文库”中已确认的论文集合,自动生成个人学术知识网络的可视化呈现:

  • 以力导向图形态展示论文间的语义关联,连线表示从属、语义相似等关系,相似论文自动聚集成研究簇,
  • 语义相似度计算基于通义千问 Embedding 模型(1536 维语义向量)
  • 支持拖拽节点调整布局、缩放查看全局或局部、选择四要素子节点的显示状态
  • 支持按文件夹筛选载入范围,仅已确认状态的论文参与图谱构建
  • 点击任意节点可弹出侧边栏,查看论文基本信息、关键词摘要预览及关联节点列表等信息,并支持跳转至论文预览界面

应用场景

经过数周的文献积累,张同学的文库中已有超过五十篇确认论文。为准备向导师汇报调研进展,他启用知识图谱功能,将所有论文生成为一张知识网络。图中自动聚出几个主要研究簇,几篇横跨多簇的论文以连线表示交叉关系。汇报时,张同学通过拖拽节点,向导师展示了各方向的关联性以及两个可能的研究空白点,并据此梳理了开题思路。

1.6 论文预览与笔记

实现需求

在论文预览界面提供集成化的阅读与批注环境,将原文浏览和笔记记录无缝衔接:

  • 直接渲染 PDF 原文,支持连续滚动阅读、页码跳转和缩放
  • 为每篇论文添加文本笔记,记录阅读过程中的思考、疑问和总结;所有笔记修改即时自动保存,无需手动提交

应用场景

张同学锁定一篇需要进行精读的论文后,在 Scider 中直接打开 PDF 预览。页面左侧显示原文,右侧为笔记面板。阅读过程中,他在笔记栏记录了创新点的比较、对实验数据集划分的疑问等内容,笔记被自动保存,可供后续引用和复现时查阅。

运行环境

本平台 Alpha 阶段为 Web 应用,用户无需安装任何客户端软件,通过浏览器即可访问全部功能。

运行环境

操作系统 浏览器及版本
macOS 14+ Chrome 120+、Safari 17+、Firefox 120+、Edge 120+
Windows 10/11 Chrome 120+、Firefox 120+、Edge 120+

最低运行要求

  • 浏览器需启用 JavaScript
  • 屏幕分辨率不低于 1366×768(推荐 1920×1080)
  • 需要能够正常访问以下域名:
    • api.semanticscholar.org(论文检索)
    • dashscope.aliyuncs.com(阿里云通义千问 API)

移动端适配说明

Alpha 阶段尚未完成移动端适配。在屏幕宽度小于 768px 的设备上访问,页面布局可能出现错位,PDF 预览的缩放与翻页操作体验欠佳。建议使用平板或桌面设备进行详细论文阅读。

安装与使用方法

访问方式

本软件为 Web 应用,无需安装。直接在浏览器地址栏输入 http://39.107.252.200 即可访问。

注册方式

平台支持用户自行注册:

  1. 访问首页,点击右上角“注册”按钮
  2. 填写邮箱地址和密码(密码不少于 6 位)
  3. 点击“注册”完成账号创建

新用户入门流程

  1. 注册登录:使用邮箱和密码注册账号并登录系统
  2. 建立文库:进入“我的文库”,创建文件夹搭建个人文献分类结构
  3. 上传论文:点击“上传 PDF”按钮,选择或拖拽 PDF 文件,等待后台解析(通常在 1 分钟以内)
  4. 确认关键词:解析完成后点击论文卡片,在抽屉中查看并确认 AI 提取的四要素内容
  5. 发现新论文:进入“发现论文”栏目,通过关键词检索获取更多文献
  6. 探索知识图谱:上传 3 篇以上并确认状态的论文后,进入“知识图谱”页面,选择文件夹生成图谱并交互探索

进阶功能

  • 上下游检索:在“发现论文”页面,选择已入库的论文查看其参考文献与引用文献
  • 添加笔记:在论文预览界面中点击“笔记”标签,即可记录阅读思考

系统已知的问题和限制

已知问题

  1. AI 四要素提取解析延迟
  • 表现:论文提交解析后,在队列繁忙时可能需要等待 3-10 分钟才能完成四要素提取
  • 触发条件:后台任务队列中存在大量待处理任务,或通义千问 API 响应较慢
  • 预计修复:Beta 版本优化任务调度机制与队列优先级
  1. 知识图谱节点过多时渲染卡顿
  • 表现:节点数超过 150 个时,拖拽、缩放操作出现明显延迟;此时也难以查看语义关联信息
  • 触发条件:选择包含大量论文的文件夹生成图谱
  • 预计修复:Beta 版本引入渲染优化
  1. 知识图谱语义关联算法有待完善
  • 表现:当前图谱完全基于 Embedding 向量相似度构建,仅能量化论文间的距离远近,无法说明具体的语义关联理由;同时,在部分领域纯相似度计算的聚类精度偏低
  • 触发条件:论文涉及跨学科内容,或文本较短、摘要信息不足
  • 预计修复:后续版本计划引入大语言模型直接生成论文间的语义关联图谱,替代当前纯 Embedding 相似度方案,以提升关联的可解释性与准确度
  1. Semantic Scholar API 偶发限流
  • 表现:短时间内大量搜索后可能返回 429 错误(Too Many Requests)
  • 触发条件:短时间内发起多次搜索请求
  • 预计修复:Beta 版本计划增加本地缓存机制
  1. AI 四要素提取解析偶有偏差
  • 表现:部分论文的 AI 提取内容存在不准确或信息不完整的情况
  • 触发条件:论文格式不规范(如双栏排版、扫描件)或内容高度专业化
  • 预计修复:持续优化 Prompt 工程与模型选择

功能限制

  1. 单文件上传上限 50MB:超大型综述论文或包含大量高清图表的论文,建议先使用压缩工具处理后上传
  2. Embedding 模型固定:当前仅支持阿里云通义千问 text-embedding-v1,暂不支持切换至 OpenAI 或 HuggingFace 等其他 Embedding 服务
  3. 离线模式不可用:论文搜索、AI 解析、知识图谱等核心功能依赖外部 API,无网络环境下仅可查看已上传的论文和笔记
  4. 数据导出未实现:暂不支持批量导出论文元数据或笔记,Beta 版本将加入导出功能
  5. 仅支持单级文件夹操作:目前文件夹不支持嵌套子文件夹,Beta 版本计划支持多级嵌套文件夹
  6. 仅支持一篇txt笔记:目前不支持多篇笔记记录,Beta版本计划优化笔记系统

软件发布方式与发布地址

在线体验

直接在浏览器中访问 http://39.107.252.200 即可使用全部功能,无需安装任何软件。

开源仓库

Scider 完全开源,可通过 GitHub 获取源码并自行部署:

git clone https://github.com/XiaCang/Scider.git
posted @ 2026-05-10 17:13  BBnomoney  阅读(63)  评论(0)    收藏  举报