当前位置: 首页 > 软件库 > 程序开发 > 中文分词库 >

HTTPCWS

开源中文分词系统
授权协议 BSD
开发语言 C/C++
所属分类 程序开发、 中文分词库
软件类型 开源软件
地区 国产
投 递 者 蓬弘
操作系统 Linux
开源组织
适用人群 未知
 软件概览

HTTPCWS是一款Linux下的基于HTTP协议的开源中文分词系统,采用BSD协议。

这个分词系统是对中国科学院计算技术研究所免费提供的 ICTCLAS 3.0 共享版分词后的结果,再采用逆向最大匹配算法,根据作者自己补充的一个9万条词语的自定义词库,对ICTCLAS分词结果进行合并处理,输出最终分词结果。目前只支持GBK编码。

经过测试,局域网内 HTTPCWS 接口中文分词平均处理速度(Wait时间):0.001秒,每秒可处理5000~20000次请求。(演示地址

  •   HTTPCWS 是一款基于HTTP协议的开源中文分词系统,目前仅支持Linux系统。HTTPCWS 使用“ICTCLAS 3.0 2009共享版中文分词算法”的API进行分词处理,得出分词结果。     1 安装.    wget http://httpcws.googlecode.com/files/httpcws-1.0.0-x86_64-bin.tar.gz tar zxvf httpc

  • 基于HTTP协议的开源中文分词系统:HTTPCWS 1.0.0 发布[原创]   发布版本:   httpcws 1.0.0 (最新版本:2009-08-10发布)   程序网址:http://code.google.com/p/httpcws   安装使用手册:http://blog.s135.com/httpcws_v100/   下载地址(32位版):http://httpcws.googl

  • HTTPCWS 是一款基于HTTP协议的开源中文分词系统。(HTTPCWS is an Chinese Word Segmentation System Based on the HTTP protocol.)  http://code.google.com/p/httpcws/ 转载于:https://www.cnblogs.com/wangpei/archive/2011/02/24/1964

  • #region 获取关键字 [AjaxPro.AjaxMethod] public string GetWords(string str) { string _value = string.Empty; byte[] gbkBuf = Encoding.GetEncoding("GBK").GetBytes(str); _va

  • [url=http://code.google.com/p/httpcws/]官方程序地址[/url] 安装在ubuntu9.10上: cd /usr/local sudo wget http://httpcws.googlecode.com/files/httpcws-1.0.0-i386-bin.tar.gz sudo su tar zxvf httpcws-1.0.0-i386-bin.ta

  •   #分词安装:   cd  /usr/local/   wget http://httpcws.googlecode.com/files/httpcws-1.0.0-x86_64-bin.tar.gz   tar zxvf httpcws-1.0.0-x86_64-bin.tar.gz   rm -f httpcws-1.0.0-x86_64-bin.tar.gz   mv httpcws-1.

 相关资料
  • Genius Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。 Feature 支持python2.x、python3.x以及pypy2.x。 支持简单的pinyin分词 支持用户自定义break 支持用户自定义合并词典 支持词性标注 Source Install 安装git: 1) ubuntu or debian

  • 本文向大家介绍开源操作系统,包括了开源操作系统的使用技巧和注意事项,需要的朋友参考一下 开源操作系统是根据许可发布的,版权所有者允许他人学习,更改并将软件分发给他人。可以出于任何原因完成此操作。市场上可用的不同开源操作系统是- 宇宙 这是一个主要使用C#语言编写的开源操作系统。其完整格式为C#开源托管操作系统。直到2016年,Cosmos都不打算成为一个完整的操作系统,而是一个允许其他开发人员轻松

  • 介绍 现阶段,应用于搜索引擎和自然语言处理的中文分词库五花八门,使用方式各不统一,虽然有适配于Lucene和Elasticsearch的插件,但是我们想在多个库之间选择更换时,依旧有学习时间。 Hutool针对常见中文分词库做了统一接口封装,既定义一套规范,隔离各个库的差异,做到一段代码,随意更换。 Hutool现在封装的引擎有: Ansj HanLP IKAnalyzer Jcseg Jieba

  • Niushop 开源商城系统为新零售系统、多商户B2B2C、单用户B2C、开源微商城、电商小程序商城、o2o商城系统公司提供免费开源商城平台。

  • 本文向大家介绍PHPAnalysis中文分词类详解,包括了PHPAnalysis中文分词类详解的使用技巧和注意事项,需要的朋友参考一下 PHPAnalysis是目前广泛使用的中文分词类,使用反向匹配模式分词,因此兼容编码更广泛,现将其变量与常用函数详解如下: 一、比较重要的成员变量 $resultType   = 1        生成的分词结果数据类型(1 为全部, 2为 词典词汇及单个中日韩简

  • 迅睿PHP开源图书小说系统是一套阅读书籍系统,基于xunruicms开发的内容管理系统,拥有相当强大的内容管理模式和灵活的扩展性能。 打造站内原创免费收费书籍阅读平台, 联合作家用户共盈利共创收,发展忠实用户,稳定提高平台流量。 以SEO性能极好的笔趣阁模板为基础,进行了大量优化,呈献给大家一款SEO优秀,不失美观大方的小说网站系统 提供功能包括: 1.网站采集器插件 2. 自定义模块内容 3、前