#cd /usr/local/coreseek
#vi etc/csft.conf
/usr/local/coreseek/etc/csft.conf
#
# Minimal Sphinx configuration sample (clean, simple, functional)
#
source src_technet_drupal_node
{
type = mysql
sql_host = the ip of drupal's mysql
sql_user = reader-user
sql_pass = reader-password
sql_db = drupal6
sql_port = 3306 # optional, default is 3306
sql_query_pre = SET NAMES utf8sql_query = SELECT nid, uid, timestamp, title, body FROM node_revisions
sql_attr_uint = uid
sql_attr_timestamp = timestampsql_query_info = SELECT * FROM node_revisions WHERE id=$id
}
index technet
{
source = src_technet_drupal_node
path = /var/data/technet
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
html_strip = 0
charset_dictpath = /usr/local/mmseg3/etc/
charset_type = zh_cn.utf-8
ngram_len = 0
}
indexer
{
mem_limit = 256M
}
searchd
{
port = 3312
log = /var/log/technet-search.log
query_log = /var/log/technet-query.log
read_timeout = 5
max_children = 30
pid_file = /var/log/technet-searchd.pid
max_matches = 1000
seamless_rotate = 1
preopen_indexes = 0
unlink_old = 1
}
#./indexer --all
很快哦,有3243篇主题,只用了4.720秒。
#./searchd --console
调试
#./searchd --stop
#./searchd
运行
php测试一下
<?php
//注意文件的编码格式需要保存为为UTF-8格式
require ( "sphinxapi.php" );
$cl = new SphinxClient ();
$cl->SetServer ( 'sphinxhost', 3312);
//以下设置用于返回数组形式的结果
$cl->SetArrayResult ( true );
/*
//ID的过滤
$cl->SetIDRange(3,4);
//sql_attr_uint等类型的属性字段,需要使用setFilter过滤,类似SQL的WHERE group_id=2
$cl->setFilter('group_id',array(2));
//sql_attr_uint等类型的属性字段,也可以设置过滤范围,类似SQL的WHERE group_id2>=6 AND group_id2<=8
$cl->SetFilterRange('group_id2',6,8);
*/
//取从头开始的前20条数据,0,20类似SQl语句的LIMIT 0,20
$cl->SetLimits(0,20);
//在做索引时,没有进行 sql_attr_类型 设置的字段,可以作为“搜索字符串”,进行全文搜索
$res = $cl->Query ( 'google,', "*" ); //"*"表示在所有索引里面同时搜索,"索引名称"则表示搜索指定的
//如果需要搜索指定全文字段的内容,可以使用扩展匹配模式:
//$cl->SetMatchMode(SPH_MATCH_EXTENDED);
//$res=cl->Query( '@title 测试' , "*")
echo '<pre>';
print_r($res['matches']);
print_r($res);
print_r($cl->GetLastError());
print_r($cl->GetLastWarning());
echo '</pre>';
?>
只查drupal的nodes是不行的,后续还要解决comments,以及mediawiki的问题。

浙公网安备 33010602011771号