CoreSeek shpinx中文分词安装

接上篇 Centos 搭建 PHP Nginx Mysql 

因为我自己安装 coreseek 之前已经搭建了好lnmp环境,所心一些依赖库早就装好了。 如果你不太清楚需要哪些依懒库可以去官网 http://www.coreseek.cn/product_install/install_on_bsd_linux/#deps  去找。你用的系统基本在里面可以找得到相应的依懒包名。

yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel

 

1、下载centos

http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz
$ tar xzvf coreseek-3.2.14.tar.gz
cd coreseek-3.2.14

2、中文测试环境检测

locale
##如果显示的不是zh_CN.UTF-8,请参考以下网址进行设置:
##locale设置
##命令行显示中文
##putty显示中文
##SecureCRT显示中文
##确保可以正常显示,否则请检查当前环境的locale配置,以及当前环境或者客户端已设置好支持UTF-8中文字符显示
cat testpack/var/test/test.xml

3、安装coreseek开发的mmseg,为coreseek提供中文分词功能

cd mmseg-3.2.14
./bootstrap
./configure --prefix=/usr/local/webserver/mmseg3
make && make install
##如果提示libtool: unrecognized option `--tag=CC' ,请查看libtool问题解决方案
##安装完成后,mmseg使用的词典和配置文件,将自动安装到/usr/local/webserver/mmseg3/etc中
##中文分词测试,如果显示不正常,请检查当前环境下的locale和UTF-8中文字符显示设置
/usr/local/webserver/mmseg3/bin/mmseg -d /usr/local/webserver/mmseg3/etc src/t1.txt
 中文/x 分/x 词/x 测试/x 
中国人/x 上海市/x
Word Splite took: 1 ms.


4、安装Coreseek

 

sh buildconf.sh
./configure --prefix=/usr/local/webserver/coreseek --without-python --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/webserver/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/webserver/mmseg3/lib/ --without-mysql
##coreseek4.x/sphinx1.x,请将--without-mysql更改为--with-mysql
##如果提示mysql问题,可以<a href="http://www.coreseek.cn/product_install/install_on_bsd_linux/#mysql">查看MySQL数据源安装说明</a>

  

 

 PS:可能遇到的问题

##如果提示libtool: unrecognized option `--tag=CC' ,请查看libtool问题解决方案

##有的系统下可能出现:expected `;' before ‘CSphTokenizer_UTF8SpaceSeg’,
##或者出现:configure: WARNING: unrecognized options: --with-mmseg, --with-mmseg-includes, --with-mmseg-libs
##是因为你没有进行随后的sh buildconf.sh操作
##生成当前系统对应的编译配置文件
##需要使用以下指令:
$ sh buildconf.sh

## Linux环境下,如遇到pthread问题,请先直接执行以下指令在进行configur:
$ LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
$ export LD_LIBRARY_PATH


## 如果出现undefined reference to `libiconv'的类似错误,可以按照如下方法处理:
##方法一:(Linux使用)
## 直接执行:export LIBS="-liconv"
##然后make clean,再次configure后,进行编译安装make && make install
## 方法二:
## 首先configure,然后vim src/makefile
## 在其中搜索lexpat,在其后加上 -liconv
## 修改后该行应该为:-lexpat -liconv -L/usr/local/lib
## 然后再次make && make install
## 方法三:
## 首先configure,然后vim config/config.h
## 在其中搜索USE_LIBICONV,将其后的1修改为0
## 然后再次make && make install

5、测试

/usr/local/webserver/coreseek/bin/indexer -c /usr/local/webserver/coreseek/etc/sphinx-min.conf.dist
##以下为正常测试时的提示信息:
Coreseek Fulltext 3.2 [ Sphinx 0.9.9-release (r2117)]
Copyright (c) 2007-2010,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
     using config file '/usr/local/coreseek/etc/sphinx-min.conf.dist'...
total 0 reads, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
total 0 writes, 0.000 sec, 0.0 kb/call avg, 0.0 msec/call avg
##
##csft-4.0版显示:ERROR: nothing to do.
##
##至此,coreseek基础环境可以正常安装,我们可以开始后续的工作啦。

 

posted on 2013-11-06 18:06  luffy丶zhao  阅读(401)  评论(0)    收藏  举报