需求规格说明书2.0
附录:需求规格说明书2.0
一、总体概述
-
软件概述
一款基于网络爬虫的电影信息采集及相关内容推荐系统,为广大热爱电影的用户提供更加简洁的电影信息资源呈现和高效的电影推荐系统
主要实现:
- 强大的信息采集系统
- 更加简洁的电影信息呈现
- 更加精确高效的电影推荐系统
-
软件功能
功能 详细描述 登录注册 使用账号密码登录 用户根据系统要求地信息格式注册一个账号 电影信息存储 用户登陆后开始爬取电影信息,存入数据库中 电影信息展示 制作美观接受度高的UI界面:将爬取到的信息以可视化的方式呈现,并能够展现电影影评以及电影截图。 电影搜索 用户在输入框中输入电影的名字,系统将最佳匹配的结果返回 用户个人页面 呈现用户的个人信息、修改密码选项以及呈现该用户喜欢的电影 推荐电影 根据点击的电影的类别、页面停留的时长、影评参与程度以及对电影的评分等行为分析,基于推荐算法给用户推荐其可能喜欢的电影。 电影链接 用户可以直接在软件内获取感兴趣的电影的链接进行观看或下载,节省了用户获取电影资源的时间。 -
用户分析
本产品主要面向喜欢刷豆瓣的电影爱好者。豆瓣集中了许多爱好电影的粉丝并且提供了良好的交流环境,我们的用户主要是经常使用豆瓣参与电影评分撰写影评以及通过豆瓣参考电影的用户。
信息 描述 性别 男 年龄 21 职业 学生 收入 暂无 身份 广工计算机学院大三学生 知识层次和能力 本科在读,对软件应用比较熟悉 使用目的 查找喜欢的电影 用户偏好 电影库存多,介绍详细 典型场景 无聊时查找电影观看 典型描述 根据电影推荐查找电影观看 信息 描述 性别 女 年龄 19 职业 学生 收入 暂无 身份 广工外国语学院大二学生 知识层次和能力 本科在读,对软件应用比较熟悉 使用目的 观看一些电影介绍 用户偏好 电影介绍生动多元 典型场景 老师要求写影评作业 典型描述 观看电影影评以及查找类似电影 信息 描述 性别 女 年龄 45 职业 某公司部门主管 收入 1.5w/月 身份 上班族 知识层次和能力 本科学历,较少网上冲浪 使用目的 找电影看 用户偏好 操作方便且简单 典型场景 下班无聊看电影 典型描述 根据电影推荐查找电影观看 -
模块构成
-
爬虫模块
爬取电影的类别、页面停留的时长、影评参与程度以及对电影的评分等数据。
-
推荐算法模块
基于推荐算法给用户推荐其可能喜欢的电影。
-
数据存储模块
把爬虫爬取的数据导入到本地文件夹和数据库
-
用户登陆模块
跟数据库交互实现用户登录功能。
-
ui界面模块
呈现用户的个人信息、修改密码选项以及按推送算法结果呈现该用户可能喜欢的电影。
-
二、 技术分析
-
开发技术选型
技术项 具体技术 算法推荐 Python3.8.0、基于物品的协同过滤算法 爬虫 Scrapy、Xpath和Request等库 页面展示 PyQt5 数据库 MySQL 8.0 代码版本控制 Git 推荐电影 根据用户的行为,基于推荐算法给用户推荐其可能喜欢的电影 -
性能需求
- 系统的响应时间RT应该在200ms以内
- 系统应该至少能够承载两万条以上的爬取信息记录
- 系统应该至少能够承载一千个以上的总用户量
三、系统设计
-
系统架构设计
本项目需要实现的是基于协同过滤算法的爬虫电影推荐系统,需要解决电影信息的收集,推荐算法的实现和更加简洁的图形化界面。
根据组内成员对需求的分析,得出下图系统架构图。当中各个模块分别对应本系统的各个需求。
-
数据库设计