浏览模式: 标准 | 列表

一款基于HTTP协议的开源中文分词系统 HTTPCWS

作者:memory 发布时间:2011-11-10, 19:50:05 分类:服务器相关 阅读:225

HTTPCWS 是一款基于HTTP协议的开源中文分词系统,目前仅支持Linux系统。HTTPCWS 使用“ICTCLAS 3.0 2009共享版中文分词算法”的API进行分词处理,得出分词结果。

httpcws 中文分词系统的下载及配置安装 附使用案例

作者:memory 发布时间:2011-11-10, 19:55:57 分类:服务器相关 阅读:345

HTTPCWS 属于《[http://blog.s135.com/post/385.htm 亿级数据的高并发通用搜索引擎架构设计]》的一部分,用作“搜索查询接口”的关键字分词处理。在此架构中,Sphinx索引引擎对于CJK(中日韩)语言支持一元切分,假设【反恐行动是国产主视角射击网络游戏】这段文字,Sphinx会将其切成【反 恐 行 动 是 国 产 主 视 角 射 击 网 络 游 戏】,然后对每个字建立反向索引
第1页共1页1