当前位置：首页 > 软件库 > 程序开发 > 搜索引擎 >

MG4J

全文本索引引擎

授权协议 LGPL

开发语言 Java Perl

所属分类程序开发、搜索引擎

软件类型开源软件

地区不详

投递者毕宇

操作系统跨平台

开源组织无

适用人群未知

软件官网

官方下载

安全指数

软件概览

MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引,通过使内插编码(interpolative coding)技术.

MG4J(为Java管理千兆字节)是一个免费的全文搜索引擎，用于Java编写的大型文档集合。MG4J是一个高度可定制、高性能、功能完备的搜索引擎，提供了最先进的功能(比如BM25/BM25F评分)和新的研究算法。

使用案例

第 13 章 MG4J

http://mg4j.dsi.unimi.it/ 原文出处：Netkiller 系列手札本文作者：陈景峯转载请与作者联系，同时请务必标明文章原始出处和作者信息及本声明。
mg4j的理解

mg4j是个类似于lucene的全文检索包，发现网上的资料很少，稍微总结下心得。 1、DocumentSequence：A sequence of documents 主要包含方法 DocumentFactory factory() DocumentIterator iterator() 2、it.unimi.di.big.mg4j.document. DocumentIterator
初试MG4J

按照网站提供的manual中的A Quick Tour of MG4J完成。在mg4j的官方网站下载[url=http://mg4j.dsi.unimi.it/mg4j-2.1.1-bin.tar.gz]binary tarball[/url]和[url=http://mg4j.dsi.unimi.it/mg4j-deps.tar.gz]dependencies tarball[/url]，解压
MG4J 是什么

MG4J 是另一个搜索engine 。与Lucene 主要区别是，它提供了cluster 功能，具有更OO的设计方式。中文名 MG4J 外文名 Managing Gigabytes for Java 特点提供cluster 功能对象软件工程师 MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引，通过使内插编码(interpolative coding)技术。
lucene、sphinx和mg4j各自的优点和缺点，以及它们的应用范围

（1）索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。（2）在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。（3）优秀的面向对象的系统架构，使得对于Lucene扩展的学习难度降低，方便扩充新功能。（4）设计了独立
MG4J

MG4J （常务千兆字节的Java ）是一个免费的全文搜索引擎的大文档集合Java编写的。要点MG4J是： *强大的索引。支持文件的集合和工厂使我们能够分析，索引和查询一贯大文件汇编，提供易于理解的片段，强调有关段落中检索文件。 *效率。我们不提供毫无意义的数据，如“我们指数x培养基每秒” （与配置？哪种语言？该数据源？），我们邀请您来试试。指数没有MG4J可以努力的TR
lucene-替代品MG4J

搜索engine-MG4J 　　MG4J 是另一个搜索engine 。与Lucene 主要区别是，它提供了cluster 功能，具有更OO的设计方式。　　MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引，通过使内插编码(interpolativecoding)技术。　　虽然MG4J（Managing Gigabytes forJava）不是一个像Lucene、Egothor和Xapi
Lucene，MG4J ，Sphinx全文检索引擎的优点

Lucene作为一个全文检索引擎，其具有如下突出的优点：　　（1）索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式，使得兼容系统或者不同平台的应用能够共享建立的索引文件。　　（2）在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文件索引，提升索引速度。然后通过与原有索引的合并，达到优化的目的。　　（3）优秀的面向对象的系统架
全文搜索引擎MG4J

MG4J (Managing Gigabytes for Java) is a free full-text search engine for large document collections written in Java. The main points of MG4J are: * Powerful indexing. Support for document collections

MG4J

同类工具

相关阅读

相关文章

相关问答

相关文档