当前位置：首页 > 软件库 > 程序开发 > 其他开发相关 >

Chunker

内容定义组块实现

授权协议 BSD

开发语言 Google Go

所属分类程序开发、其他开发相关

软件类型开源软件

地区不详

投递者东门涵育

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

Chunker 是基于滚动 Rabin Hash 实现内容定义组块（CDC）。

CDC 算法是一种变长分块算法，它应用数据指纹(如Rabin指纹)将文件分割成长度大小不等的分块策略。与定长分块算法不同，它是基于文件内容进行数据块切分的，因此数据块大小是可变化的。

package chunker

import "github.com/restic/chunker"

对于以十六进制系数表示法对指定的多项式列表进行过滤，可以使用以下脚本：

# create x over F_2 = GF(2)
x := Indeterminate(GF(2), "x");

# test if polynomial is irreducible, i.e. the number of factors is one
IrredPoly := function (poly)
	return (Length(Factors(poly)) = 1);
end;;

# create a polynomial in x from the hexadecimal representation of the
# coefficients
Hex2Poly := function (s)
	return ValuePol(CoefficientsQadic(IntHexString(s), 2), x);
end;;

# list of candidates, in hex
candidates := [ "3DA3358B4DC173" ];

# create real polynomials
L := List(candidates, Hex2Poly);

# filter and display the list of irreducible polynomials contained in L
Display(Filtered(L, x -> (IrredPoly(x))));

使用案例

[NLP]OpenNLP块检测器(Chunker)的使用

Chunker 分块是将文章的内容分成句法相关的词组，如名词组、动词组，但不指定它们的内部结构，也不说明它们在主句中的作用。训练数据的输入格式如下： Rockwell NNP B-NP International NNP I-NP Corp. NNP I-NP 's POS B-NP Tulsa NNP I-NP unit NN I-NP said VBD B-VP it PRP B-NP si
java-如何在Opennlp中训练Chunker？

我需要在Opennlp中训练Chunker,以将训练数据分类为名词短语.我该如何进行？在线文档没有解释如何在没有命令行的情况下执行此操作,该文档已包含在程序中.它说使用en-chunker.train,但是如何制作该文件？编辑：@Alaye 运行您在答案中给出的代码后,出现以下无法修复的错误： Indexing events using cutoff of 5 Computing event c
jQuery技术内幕：深入解析jQuery架构设计与实现原理. 3.5　正则chunker

3.5　正则chunker 正则chunker用于从选择器表达式中提取块表达式和块间关系符。该正则是Sizzle中最长、最复杂和最关键的正则，图3-4是该正则的分解图，图中包含了每个子块的功能介绍和测试用例。
NLTK Regex Chunker未在一个命令中处理多个语法规则

我试图从我的语料库中提取短语。为此，我定义了两个规则，一个是名词后跟多个名词，另一个是形容词后接名词，这里我希望如果从两个规则中提取相同的短语，程序应该忽略第二个规则，我面临的问题是这些短语只从第一个规则中提取，并且第二条规则不适用。代码如下：PATTERN = r""" NP: {+} {*} """ MIN_FREQ = 1 MIN_CVAL = -13 # lowest cval -13
Could not initialize English chunker/Could not load file from classpath: ‘/en-token.bin

具体错误： java.lang.RuntimeException: Could not initialize English chunker at org.languagetool.chunking.EnglishChunker.<init>(EnglishChunker.java:72) at org.languagetool.language.English.createDefaultCh

Chunker

同类工具

相关阅读

相关文章

相关问答

相关文档