当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

NlpBamboo

中文分词库

授权协议 BSD

开发语言 C/C++

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者廉高邈

操作系统 Linux

开源组织无

适用人群未知

软件官网

官方下载

软件概览

bamboo是一个中文语言处理系统。目前包括中文分词和词性标注部分。

bamboo提供了C,PHP,PostgreSQL的编程接口。

使用案例

nlpbamboo中文语言处理

Bamboo项目介绍 Bamboo项目是一个基于机器学习技术的中文自然语言处理平台。 Bamboo项目的主要目标：中文分词词性标注命名实体识别主题词抽取 Bamboo安装部署方法一: 安装打过包的最新稳定版下载源代码 http://nlpbamboo.googlecode.com/files/nlpbamboo-1.1.2.tar.bz2 安装CRF++工具包请参考 http://c
PG使用 nlpbamboo chinesecfg 中文分词

环境： CentOS 6.5 64bit PostgreSQL 9.4.4 nlpbamboo-1.1.2 cmake-3.3.1 CRF++-0.57 2.安装cmake [root@prod /opt]# wegt http://www.cmake.org/files/v3.3/cmake-3.3.1.tar.gz [root@prod /opt]#cd cmake-3.3.1 [root@p
PostgreSQL的全文检索中文分词(1)-NlpBamboo

postgres 8.3提供了2个数据类型tsvector,tsquery来支持全文检索，所以只需要一个中文分词组件就可以提供中文全文检索。google..很快发现了NlpBamboo项目，使用起来很方便。安装和配置NlpBamboo 1.安装编译工具cmake apt-get install cmake 2.安装Bamboo依赖库crf++，下载crf++代码后 cd CRF++ ./conf
借助 NlpBamboo 中文分词打造 PostgreSQL 的全文检索

借助 NlpBamboo 中文分词打造 PostgreSQL 的全文检索借助 NlpBamboo 中文分词打造 PostgreSQL 的全文检索 « The Magic DIrk 借助 NlpBamboo 中文分词打造 PostgreSQL 的全文检索 FreeBSD , Web开发添加评论 PostgreSQL 从 8.3 开始内建了全文检索功能，对于我们来说，只需要再找一个中文分词组件即可
PostgreSQL的全文检索中文分词(2)-NlpBamboo

PostgreSQL 从 8.3 开始内建了全文检索功能，对于我们来说，只需要再找一个中文分词组件即可利用 PostgreSQL 打造完善的全文检索应用。我选择的是 NlpBamboo 这个分词库。以下是在 FreeBSD 7.2 + PostgreSQL 8.3 环境下的配置过程（FreeBSD 和 PostgreSQL 相关的安装和设置请自行找资料）。 1、安装 CMake： 1 cd /u

相关资料

genius中文分词

Genius Genius是一个开源的python中文分词组件，采用 CRF(Conditional Random Field)条件随机场算法。 Feature 支持python2.x、python3.x以及pypy2.x。支持简单的pinyin分词支持用户自定义break 支持用户自定义合并词典支持词性标注 Source Install 安装git: 1) ubuntu or debian
中文分词封装-TokenizerUtil

介绍现阶段，应用于搜索引擎和自然语言处理的中文分词库五花八门，使用方式各不统一，虽然有适配于Lucene和Elasticsearch的插件，但是我们想在多个库之间选择更换时，依旧有学习时间。 Hutool针对常见中文分词库做了统一接口封装，既定义一套规范，隔离各个库的差异，做到一段代码，随意更换。 Hutool现在封装的引擎有： Ansj HanLP IKAnalyzer Jcseg Jieba
PHPAnalysis中文分词类详解

本文向大家介绍PHPAnalysis中文分词类详解，包括了PHPAnalysis中文分词类详解的使用技巧和注意事项，需要的朋友参考一下 PHPAnalysis是目前广泛使用的中文分词类，使用反向匹配模式分词，因此兼容编码更广泛，现将其变量与常用函数详解如下：一、比较重要的成员变量 $resultType = 1 生成的分词结果数据类型(1 为全部， 2为词典词汇及单个中日韩简
探究中文分词的艺术

中文分词是怎么走到今天的话说上个世纪，中文自动分词还处于初级阶段，每句话都要到汉语词表中查找，有没有这个词？有没有这个词？所以研究集中在：怎么查找最快、最全、最准、最狠......，所以就出现了正向最大匹配法、逆向最大匹配法、双向扫描法、助词遍历法......，用新世纪比较流行的一个词来形容就是：你太low了！中文自动分词最难的两个问题：1）歧义消除；2）未登陆词识别。说句公道话，没有上个世纪
10.1.中文分词核心配置

关于中文分词的详细配置实例和分词词典的自定义设置，可以访问Coreseek网站中文分词核心配置查看。核心配置： charset_dictpath = /usr/local/mmseg3/etc/ charset_type = zh_cn.utf-8 #charset_table = .................... #需将原有的该配置注释掉 ngram_le
python中文分词库jieba使用方法详解

本文向大家介绍python中文分词库jieba使用方法详解，包括了python中文分词库jieba使用方法详解的使用技巧和注意事项，需要的朋友参考一下安装python中文分词库jieba 法1：Anaconda Prompt下输入conda install jieba 法2：Terminal下输入pip3 install jieba 1、分词 1.1、CUT函数简介 cut(sentence,

NlpBamboo

同类工具

相关阅读

相关文章

相关问答

相关文档