文章标题 标签提取
    
            
摘要:引用PanGuDLLprivate string GetWords(string input) { ICollection<PanGu.WordInfo> words = new Segment().DoSegment(input); StringBuilder result = new StringBuilder(); List<string> list = new List<string>(); foreach (WordInfo word in words) { if (word != null && word.Word.Length 
        
阅读全文
                posted @ 
2012-02-05 23:24 
freexiaoyu
        
阅读(581) 
         
        推荐(0)     
             
            
            
    HubbleDotNet 基本语法
    
            
摘要:去重[Distinct('ComID')]select top 100 * from job_jobComID类型必须设置为Untokenized分组显示[GroupBy('Count', '*', 'ComID', 10)]select top 10 * from job_job order by score desc第一个参数表示采用什么统计函数,目前只支持 Count,以后还会增加 Sum, AVG 等等。第二个参数为统计函数参数,填* ,相当于 count(*)第三个参数为要统计的字段名,Group By 字段必须为 un
        
阅读全文
                posted @ 
2011-12-02 11:26 
freexiaoyu
        
阅读(356) 
         
        推荐(0)     
             
            
            
    PanGu分词方法
    
            
摘要:#region 方法:对要搜索的词分词第一种方法 /// <summary> /// 对要搜索的词分词第一种方法 /// </summary> /// <param name="keywords">要分的关键词</param> /// <param name="ktTokenizer"></param> /// <returns></returns> static public string GetKeyWordsSplitBySpace(string key
        
阅读全文
                posted @ 
2011-07-22 17:28 
freexiaoyu
        
阅读(697) 
         
        推荐(0)     
             
            
            
    PanGu词库批量添加关键词
    
            
摘要:using PanGu;using PanGu.Dict; public partial class Form1 : Form { string _Version = ""; POS _pos = POS.POS_A_NR; int _SaveCount = 1000; int _Count = 0; public Form1() { InitializeComponent(); } private void btnInsert_Click(object sender, EventArgs e) { string strFileName = @"G:\vs2010
        
阅读全文
                posted @ 
2011-07-16 10:37 
freexiaoyu
        
阅读(1852) 
         
        推荐(1)     
             
            
            
    hubbledotnet查询速度慢的问题
    
            
摘要:如果查询条件中没有用到match,contains条件查询的话,那么这条语句查询方式是直接去数据库查询然后返回数据。不就是SQL中的索引优化问题只有用 match, contains 才能用到全文索引,否则都是去数据库查全文是用倒排索引,非全文是B树索引,hubble没有建B树索引,因为数据库这块已经做的很好了,hubble没比较再做一遍所以如果非全文查询,就转到数据库查,但数据库相应的索引要优化好倒排索引是不能查范围的
        
阅读全文
                posted @ 
2011-06-20 10:53 
freexiaoyu
        
阅读(346) 
         
        推荐(0)     
             
            
            
    hubbledotnet 例子中对搜索关键字的分词方法
    
            
摘要:public string GetKeywordAnalyzerStringFromServer(string tableName, string fieldName, string keywords, int cacheTimeout, out string bySpace) { StringBuilder sb = new StringBuilder(); sb.AppendFormat("exec SP_FieldAnalyze '{0}', '{1}', '{2}', 'sqlclient' ", ..
        
阅读全文
                posted @ 
2011-06-07 15:19 
freexiaoyu
        
阅读(562) 
         
        推荐(1)     
             
            
            
    hubbledotnet 远程连接提示:无法从传输连接中读取数据:远程主机强迫关闭一个现有的连接
    
            
摘要:我用本地hubbledotnet(安装32位)去连接服务器hubbledotnet(64位) 提示:无法从传输连接中读取数据:远程主机强迫关闭一个现有的连接这种原因是服务器上的7523端口未添加打开控制面板--》打开windows防火墙--》更改设置--》例外--》添加端口 名称我用的hubble 端口 7523 协议 TCP点击确定,就OK了。
        
阅读全文
                posted @ 
2011-05-31 08:59 
freexiaoyu
        
阅读(623) 
         
        推荐(0)     
             
            
            
    hubbledotnet 定时更新索引
    
            
摘要:文章:http://www.cnblogs.com/eaglet/archive/2010/08/25/1808143.html这里用的是update模式创建表1、首先在数据库中创建触发器表CREATE TABLE [HBTrigger_job_SearchKey] ([Serial] [bigint] IDENTITY (1, 1) NOT NULL,[Id] [int] NOT NULL,[Opr] [char] (16) NULL,[Fields] [nvarchar] (4000) NULL)ALTER TABLE [HBTrigger_job_SearchKey] WITH NOCH
        
阅读全文
                posted @ 
2011-05-27 14:21 
freexiaoyu
        
阅读(783) 
         
        推荐(1)     
             
            
            
    hubbledotnet 查询提示:已添加了具有相同键的项
    
            
摘要:按eaglet博客 说明创建索引 原文创建完成后 查询时提示已添加了具有相同键的项原因是 表中有一个类型为SmallInt类型把该类型改为Int类型就可以了。如果不是上述情况 那么就检查你的ID是不是唯一
        
阅读全文
                posted @ 
2011-05-24 09:04 
freexiaoyu
        
阅读(577) 
         
        推荐(0)