eaglet

本博专注于基于微软技术的搜索相关技术
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

HubbleDotNet开源全文搜索数据库项目--技术详解

Posted on 2010-04-07 14:44  eaglet  阅读(48960)  评论(180编辑  收藏  举报

HubbleDotNet 简介

HubbleDotNet 和 Lucene.net 性能对比测试

HubbleDotNet 和 Lucene.Net 匹配相关度的比较

HubbleDotNet 软件架构

安装和升级

   安装

   升级

用户权限--功能规划中

   默认帐号**

   添加帐号**

   帐号权限**

   

索引

   Hubble.net 的数据库和数据表

       Hubble.net 数据表的数据类型

       创建、删除数据库

       创建数据表

       为数据库现有表或视图建立全文索引(一) Append Only 模式

       为数据库现有表或视图建立全文索引(二) Updatable 模式

       为数据库现有表或视图建立全文索引(三) 多表关联全文索引模式

       通过程序和现有表或视图同步

       自动和现有表同步

       通过后台任务自动同步或优化索引

       自动与Oracle中的数据同步解析

   内存索引

   倒排索引结构*

   倒排索引优化*

   UnTokenized 索引*

   关系数据库索引*

搜索

   搜索的基本流程*

   HubbleDotNet开源全文搜索数据库项目--查询方法汇总

   对 Tokenized 字段搜索*

       搜索语法*

           指定单词权重

           指定字段权重

           指定文档权重

       Match 方式

       Contains 方式

       Like 方式*

       组合搜索*      

   Tokenized字段和Untokenized 字段组合搜索*      

   Tokenized字段和关系数据库索引字段组合搜索*      

   多表联合搜索*

       同构表的联合搜索

       异构表的联合搜索

   编写自己的得分算法*

分词器 

      SimpleAnalyzer*

      EnglishAnalyzer*

      PanGuSegment*

      HubbleDotNet 索引分词的测试方法和分词技巧

      编写自己的分词器

数据库适配器*

      SQLSERVER 2005

      SQLSERVER 2000

      连接 Oracle 数据库

      HubbleDotNet+Mongodb 构建高性能搜索引擎--概述

      编写自己的数据库适配器*

 

性能优化 

      大量并发访问的解决方案 

      各种数据类型占用内存情况*

      优化分词器*

      查询级别缓存*

      查询级别缓存的持久化*

      数据级别缓存*

      不同搜索方式的性能*     

      分布式查询*

      执行跟踪报告*

          如何让查询分析器输出执行跟踪报告*

          如何分析执行跟踪报告*

分布式查询 

          HubbleDotNet 分布式检索算法介绍 (一)

          HubbleDotNet 分布式检索--异步通讯模式的调用方法

测试报告

      HubbleDotNet 海量数据测试报告

远程访问*

 

SQLClient*

      大量并发访问的解决方案 

      异步通讯模式的调用方法

示例*

 

项目应用*

 

注:

* 为还没有完成的文档
** 为功能目前尚未实现