httpcws 中文分词系统的下载及配置安装 附使用案例
作者:memory 发布时间:2011-11-10, 19:55:57 分类:服务器相关 阅读:360
HTTPCWS 属于《[http://blog.s135.com/post/385.htm 亿级数据的高并发通用搜索引擎架构设计]》的一部分,用作“搜索查询接口”的关键字分词处理。在此架构中,Sphinx索引引擎对于CJK(中日韩)语言支持一元切分,假设【反恐行动是国产主视角射击网络游戏】这段文字,Sphinx会将其切成【反 恐 行 动 是 国 产 主 视 角 射 击 网 络 游 戏】,然后对每个字建立反向索引



