学霸系统PipeLine功能规格说明书

学霸系统PipeLine功能规格说明书共分为以下三部分:

1.产品面向用户群体

2.用户使用说明

3.产品功能具体实现



1.产品面向用户群体

我们这组的项目并不是传统意义上能发布并进行展示的项目,因此相对应的面向的用户群体也不是传统意义上的用户。我们面向的用户是学霸系统UI组。

 

2.用户使用说明(即UI组调用数据库的方式)

UI组在制作提问与解答模块时需要用到我们放在服务器中的数据库。我们的数据库中的数据表共有四张。

1.WebPage表

这张表里面存有每个网页的具体属性信息。

sql语言表示数据表定义如下:

Create Table WebPage{
wid int primary key,    //wid是我们UI组查询必须要用到的唯一标识一个网页的标识
title nvarchar(255) not null, //标题
author nvarchar(255)   //作者
postdate date   //发表日期
link nvarchar(255) not null, //链接
referred nvarchar(255)   //引用
views int not null,              //学霸网站内的浏览量(初始化为0)
rate smallint not null           //各个评分等级的比率
}

2.WebPage_Tags表

这张表的主要作用是连接网页表与标签表。

这张表中的内容主要是网页号,标签号,还有每个网页对应标签的对应信息。

sql语言表示数据表定义如下:

Create Table WebPage_Tags{       //用于连接网页表与标签表

tid int not null,

wid int not null,

primary key (taid,wid)

preview nvarchar(255)

}

3.Tags表

这张表的主要内容是具体每个标签的属性信息。

sql语言表示数据表定义如下:

Create Table Tags{       //标签(提取的关键字)

tid int primary key not null,
name char(20) not null,
prevtaid int

}

4.Sensitive_Words表

这张表的主要内容是每个敏感词的属性信息。

sql语言表示数据表定义如下:

Create Table Sensitive_Words{       //敏感词

sid int primary key not null,

name char(20) not null

}

UI组在制作用户提问与解答时才需要我们组制作的数据库。UI组首先调用Sensitive_Words表判断用户提问中是否存在敏感词,若无敏感词,首先将问题分割成若干个tags,然后去WebPage_Tags表中匹配哪个网页能够匹配到最多的tags,然后就将这个网页对应的preview提取出来作为问题的答案;对于其余还没有对应的tags,递归的寻找哪个网页能够匹配到最多的tags,然后就将这个网页对应的preview提取出来作为问题的答案。

 

3.产品功能具体实现

我们的功能具体实现主要是改进上一届学长的各种分词算法和提取关键词的算法。因为我们这个项目的主要改进是在数据库信息的呈现效果上,UI并不是重点,因此最后的UI打算还是沿用学长的UI进行展示流程。

                                                                                                ——edited by 柴泽华

posted on 2013-11-06 01:59  IloveSE  阅读(341)  评论(0编辑  收藏  举报