当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

jieba.NET

结巴分词 .NET 版

授权协议 MIT

开发语言 .NET

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者白修谨

操作系统 Windows

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

jieba.NET 是 jieba 中文分词的 .NET 版本（C#实现）。当前版本为 0.37.1，基于 jieba 0.37，目标是提供与 jieba 一致的功能与接口，但以后可能会在 jieba 基础上提供其它扩展功能。当前主要提供分词、词性标注和关键词提取功能。

特点

支持三种分词模式：
- 精确模式，试图将句子最精确地切开，适合文本分析；
- 全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；
- 搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。
支持繁体分词
支持自定义词典
MIT 授权协议

使用案例

jieba.net与Lucene.NET的集成

一、jiebaForLuceneNet的使用 JiebaAnalyzer：与Lucene.NET集成的主接口，添加索引和搜索时使用此类的实例作为analyzer参数 JiebaTokenizer：为JiebaAnalyzer提供分词功能 Integration.LuceneNet.Sample项目中有示例，演示如何通过jieba分词添加索引和搜索二、若对Lucene.NET不甚熟悉，请先看： L
jieba.NET是jieba中文分词的.NET版本（C#实现）。

jieba.NET是jieba中文分词的.NET版本（C#实现）。当前版本为0.38.2，基于jieba 0.38，提供与jieba一致的功能与接口，以后可能会在jieba基础上提供其它扩展功能。关于jieba的实现思路，可以看看这篇wiki里提到的资料。如果您在开发中遇到与分词有关的需求或困难，请提交一个Issue，I see u:) 特点支持三种分词模式：精确模式，试图将句子最精确地切
jieba.NET与Lucene.Net的集成

首先声明：我对Lucene.Net并不熟悉，但搜索确实是分词的一个重要应用，所以这里还是尝试将两者集成起来，也许对你有一参考。看到了两个中文分词与Lucene.Net的集成项目：Lucene.Net.Analysis.PanGu和Lucene.Net.Analysis.MMSeg，参考其中的代码实现了最简单的集成：jiebaForLuceneNet。下面给出简单的介绍。 1、JiebaToken
（转）jieba中文分词的.NET版本：jieba.NET

简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词，于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单，同时分词的结果也令人印象深刻，有兴趣的可以到它的在线演示站点体验下（注意第三行文字）。 .NET平台上常见的分词组件是盘古分词，但是已经好久没有更新了。最明显的是内置词典，jieba的词典有50万个词条，而盘古的词典是17万，这样会造成明显不
.net中文分词 jieba.NET

简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词，于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单，同时分词的结果也令人印象深刻，有兴趣的可以到它的在线演示站点体验下（注意第三行文字）。 .NET平台上常见的分词组件是盘古分词，但是已经好久没有更新了。最明显的是内置词典，jieba的词典有50万个词条，而盘古的词典是17万，这样会造成明显不

jieba.NET

特点

同类工具

相关阅读

相关文章

相关问答

相关文档