以下是小弟对学校里目前的Ftp资源导航所提出的技术设想,现状是:校内现在有很多Ftp站点,以联盟形式管理,每个站点有自己的管理员,现在有一套基于定期到Ftp站点取目录数据的数据库搜索引擎,我想做个改进:
小弟认为:目前对于校内海量的Ftp资源,普通用户如何从这些资源中找到自己想要的目标已经越来越困难了,如果没有SoffFtp搜索的话,很难筛选出自己想要的资源;
针对目前![]()
![]()
搜索
缺点:
1.随着联盟的壮大,站点的不断增加,现有的基于单服务器数据库的搜索势必在速度上会越来越慢!
2.随着站点的增多,数据采集的难度会增大,数据 的时效性也会降低;
3.没有及时向Soff 前辈注册到搜索引擎的Ftp资源将无法被搜索,很大程度上将使这部分站点在Ftp的海洋中被埋没!
4.对于越来越多涌现的Ftp站点,即使提交到搜索引擎,当用户搜索到该站点资源时,发现该站点未开机,那么这部分数据对于用户将是无用的,却耗费了搜索引擎与用户的很多时间!
分布式![]()
![]()
搜索针对现有搜索引擎
改进:
1.搜索速度将不会随着站点的飞速增加而减慢,所受的限制只是提交搜索的客户端的网络带宽与机器对远程反馈的海量数据的相应能力
2.每个节点都是实时的针对自身的搜索引擎,不存在数据采集到中央服务器的过程!
3.只要是想把自己Ftp资源共享的站长,打开提供搜索功能的服务器端(占用资源很小),即可动态加入被搜索的列表,将自己的资源向校园网发布!
4.客户得到的所有结果,都将是当前在线的,并且是实时的目标数据,节省了宝贵的时间!
分布式![]()
![]()
搜索计划可能存![]()
缺点:
1.每台Ftp必须在线时打开对外搜索服务;
2.加重了每个节点自身的资源消耗,但是我相信这只是P4机器的一小部分;
目前已经基本实现了一个可用的模型,主要由以下部件组成:
1.中央索引服务器,用于提供现在网络上所有可用结点服务器的URL,使用WebService实现
2.结点服务器,响应远程请求,实现本地文件搜索功能并将结果返回,使用.Net Remoting发布对象
3.搜索用客户端,从中央服务器得到网络上可用的搜索结点,并对接点进行都所请求!
小弟认为:目前对于校内海量的Ftp资源,普通用户如何从这些资源中找到自己想要的目标已经越来越困难了,如果没有SoffFtp搜索的话,很难筛选出自己想要的资源;
针对目前


搜索
缺点:1.随着联盟的壮大,站点的不断增加,现有的基于单服务器数据库的搜索势必在速度上会越来越慢!
2.随着站点的增多,数据采集的难度会增大,数据 的时效性也会降低;
3.没有及时向Soff 前辈注册到搜索引擎的Ftp资源将无法被搜索,很大程度上将使这部分站点在Ftp的海洋中被埋没!
4.对于越来越多涌现的Ftp站点,即使提交到搜索引擎,当用户搜索到该站点资源时,发现该站点未开机,那么这部分数据对于用户将是无用的,却耗费了搜索引擎与用户的很多时间!
分布式


搜索针对现有搜索引擎
改进:1.搜索速度将不会随着站点的飞速增加而减慢,所受的限制只是提交搜索的客户端的网络带宽与机器对远程反馈的海量数据的相应能力
2.每个节点都是实时的针对自身的搜索引擎,不存在数据采集到中央服务器的过程!
3.只要是想把自己Ftp资源共享的站长,打开提供搜索功能的服务器端(占用资源很小),即可动态加入被搜索的列表,将自己的资源向校园网发布!
4.客户得到的所有结果,都将是当前在线的,并且是实时的目标数据,节省了宝贵的时间!
分布式


搜索计划可能存
缺点:1.每台Ftp必须在线时打开对外搜索服务;
2.加重了每个节点自身的资源消耗,但是我相信这只是P4机器的一小部分;
目前已经基本实现了一个可用的模型,主要由以下部件组成:
1.中央索引服务器,用于提供现在网络上所有可用结点服务器的URL,使用WebService实现
2.结点服务器,响应远程请求,实现本地文件搜索功能并将结果返回,使用.Net Remoting发布对象
3.搜索用客户端,从中央服务器得到网络上可用的搜索结点,并对接点进行都所请求!

浙公网安备 33010602011771号