登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

永福的技术博客

Linux运维

 
 
 
 
 

日志

 
 

sphinx系列之Coreseek(1)  

2010-12-28 10:20:40|  分类: 软件编程 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Sphinx是一个在GPLv2下分发的全文检索引擎;Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行,商业使用(例如, 嵌入到其他程序中)需要联系我们以获得商业授权。

       一般而言,Sphinx是一个独立的全文搜索引擎;而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的中文全文搜索能力。Sphinx/Coreseek可以非常容易的与SQL数据库和脚本语言集成。

       Coreseek是也就是LibMMSeg和sphinx的结合,在sphinx0.99之前,要安装LibMMSeg的中文分词都要给sphinx打上中文补丁然后再安装,到这0.99,他们就把sphinx和LibMMSeg结合在一起提供中文搜索服务,不在以补丁的形式提供。 

       进入上一节下载的coreseek的目录下进行安装:

cd /usr/local/src/coreseek-3.2.13/csft-3.2.13/
./bootstrap <这一步很重要>
.
/configure --prefix=/usr/local/coreseek --with-mysql=/usr/local/mysql --with-mmseg=/usr/local/mmseg --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/

make && make install 

       这里的安装跟上一篇安装的sphinx一样的,就是加入了LibMMseg分词,安装完创建测试数据,创建搜索配置文件csft.conf,过程跟上一篇一样,但是创建索引时报了一个这样的错误:FATAL: index 'test1': 'synonyms': failed to open '/data/exceptions.txt',进入配置文件csft.conf,把/data/exceptions.txt注释掉即可,创建完索引,远行测试OK。


参考于:http://www.cnblogs.com/chenzehe/archive/2010/11/14/1877083.html

我的博客:http://rickie622.blog.163.com

  评论这张
 
阅读(1035)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018