当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

nodejieba

"结巴"分词的Node.js版本

授权协议 MIT

开发语言 JavaScript

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者陈项禹

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

NodeJieba "结巴"分词的Node.js版本

Introduction

NodeJieba只是CppJieba简单包装而成的node扩展，用来进行中文分词。

详见NodeJiebaBlog

Install

npm install nodejieba

因为npm速度很慢而且经常因为墙的原因出现莫名其妙的问题，在此强烈建议使用cnpm，命令如下：

npm --registry=http://r.cnpmjs.org install nodejieba

Usage

默认分词算法

初始化

var segment = require("nodejieba");
segment.loadDict("./node_modules/nodejieba/dict/jieba.dict.utf8", "./node_modules/nodejieba/dict/hmm_model.utf8");

阻塞式调用

var wordList = segment.cutSync("阻塞模式分词"); if (wordList.constructor == Array) // just for tutorial, this is always be true  {
    wordList.forEach(function(word) { console.log(word);     
    });
}

非阻塞式调用

segment.cut("非阻塞模式分词", function(wordList) {
    wordList.forEach(function(word) { console.log(word);     
    });
});

搜索引擎分词算法

初始化

var segment = require("nodejieba");
segment.queryLoadDict("./node_modules/nodejieba/dict/jieba.dict.utf8", "./node_modules/nodejieba/dict/hmm_model.utf8");

阻塞式调用

var wordList = segment.queryCutSync("阻塞模式分词"); if (wordList.constructor == Array) // just for tutorial, this is always be true  {
    wordList.forEach(function(word) { console.log(word);     
    });
}

非阻塞式调用

segment.queryCut("非阻塞模式分词", function(wordList) {
    wordList.forEach(function(word) { console.log(word);     
    });
});

具体用法可以参考 test/segment.js test/query_segment.js

Testing

在node v0.10.2下测试通过

Demo

http://cppjieba-webdemo.herokuapp.com/ (chrome is suggested)

Thanks

Jieba中文分词

使用案例

Node.js模块——nodejieba

一、环境配置(centOS) $ yum install gcc gcc-c++ -y $ yum install wget -y $ wget -qO- https://raw.githubusercontent.com/creationix/nvm/v0.30.1/install.sh | bash $ source ./root/.bashrc $ nvm install v8.9.4 $
nodejieba安装使用

打开 github上的nodejieba项目，查看nodejieba的使用方法。使用以下命令安装nodejieba npm install nodejieba 由于nodejieba的底层算法实现是C++，所以需要安装node-gyp来编译原生C++扩展模块。 npm install -g node-gyp 而node-gyp需要依赖环境，因此需要进行环境配置，在window系统上的配置方法有两
npm install 时出现一个关于nodejieba的错误node-pre-gyp WARN Tried to download(404)和一个MSBUILD : ...

今天在进行依赖安装的的时候，出现了一个nodejieba的报错，报错信息如下 node-pre-gyp WARN Using request for node-pre-gyp https download node-pre-gyp WARN Tried to download(404): https://github.com/yanyiwu/nodejieba/releases/download
nodejieba安装记（Windows）

导语：最近想分析一下自己在学校论坛bt的下载行为，又想耍帅，所以准备整个词云。而词云的数据来源必然是下载种子的名称、类型等。所以不可避免要针对所有下载种子做关键词检索，因此需要用到中文分词工具。因为我利用nodejs，所以在网上查找了很多资料，发现nodejie是个不错的选择。好吧，说实话主要是看了月影大大的使用 Node.js 对文本内容分词和关键词抽取这篇文章做出的选择。 nodejieba的
Win10无法安装nodejieba问题记录

问题描述在一个项目进行npm install时，一直报错，提示 nodejieba.vcxproj(20,3): error MSB4019: 未找到导入的项目“C :\Microsoft.Cpp.Default.props” 复制代码试了网上常见的方法都没有成功。最后做了尝试终于可以成功npm install了。解决方法以管理员身份运行CMD，输入以下命令安装即可。 npm --vs2
nodejieba中文分词

var nodejieba = require("nodejieba"); console.log(nodejieba.extract("升职加薪，当上CEO，走上人生巅峰。", 4)); // [ 'CEO:11.7392', '升职:10.8562', '加薪:10.6426', '巅峰:9.49396' ] node分词转载于:https://www.cnblogs.com/cina33
nodejieba 安装失败 Ubuntu 环境

问题在 Ubuntu 安装 nodejieba，不断报错。因为之前在 Mac 环境安装时遇到过类似问题，当时是因为 node 版本造成的。遂随着当前思路找下去了。解决首先更换了 node 版本为 v12.18.3 ，当然这个不是直接原因。主要还是因为装 nodejieba 缺少了预编译的环境。主要要装这个包，然后装它需要的一些环境。 https://github.com/nodejs/n
nodejieba的配置（windows）

三条命令就OK 其中出了很多岔子，由于翻墙啥的出的错也不想说了，能用就行 npm install --global --production windows-build-tools npm install -g node-gyp npm --registry=http://r.cnpmjs.org install nodejieba

nodejieba

NodeJieba "结巴"分词的Node.js版本

Introduction

Install

Usage

默认分词算法

初始化

阻塞式调用

非阻塞式调用

搜索引擎分词算法

初始化

阻塞式调用

非阻塞式调用

Testing

Demo

Thanks

同类工具

相关阅读

相关文章

相关问答

相关文档