注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

good luck guys

welcome

 
 
 

日志

 
 

sphinx系列之中文分词LibMMSeg安装(三) - Done - 博客园  

2011-09-07 13:56:25|  分类: sphinx |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

sphinx系列之中文分词LibMMSeg安装(三)

        sphinx不支持中文分词,国内也有人写了好多个分词组件,本文就讲安装LibMMSeg,它是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。

        先从http://www.coreseek.cn/news/7/99/    上下载到LibMMSeg的安装包,如下:

cd /usr/local/src/
wget http:
//www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz -c

       然后解压缩:

tar -zxv -f coreseek-3.2.13.tar.gz

       进入到mmseg所在文件夹,然后编译:

cd coreseek-3.2.13/mmseg-3.2.13/
.
/configure --prefix=/usr/local/mmseg

       编译过程中报了一个config.status: error: cannot find input file: src/Makefile.in这个的错误,然后运行下列指令再次编译就能通过了:

aclocal
libtoolize 
--force
automake 
--add-missing
autoconf
autoheader
make clean

       然后再进行编译和安装:

./configure --prefix=/usr/local/mmseg
make 
&& make install

       把mmseg的命令加到环境变量中,然后运行mmseg,就能输入安装成功的信息了:

ln -/usr/local/mmseg/bin/mmseg /bin/mmseg
mmseg

Coreseek COS(tm) MM Segment 
1.0
Copyright By Coreseek.com All Right Reserved.
Usage: mmseg 
<option> <file>
-<unidict>           Unigram Dictionary
-r           Combine with -u, used a plain text build Unigram Dictionary, default Off
-<Synonyms>           Synonyms Dictionary
-<thesaurus>          Thesaurus Dictionary
-h            print this help and exit



引文来源  sphinx系列之中文分词LibMMSeg安装(三) - Done - 博客园
  评论这张
 
阅读(957)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017