当前位置: 首页 > 软件库 > 程序开发 > 常用工具包 >

Minidx

信息抽取组件
授权协议 未知
开发语言 C/C++
所属分类 程序开发、 常用工具包
软件类型 开源软件
地区 不详
投 递 者 扈高逸
操作系统 Windows
开源组织
适用人群 未知
 软件概览

Minidx 这一组件是专门为开发人员准备的,利用Minidx Extract-Text Com组件,您可以轻松的从Word,Xls,Pdf……等200多种文件格式中读取文本内容。该组件本身用C++编写,以Com组件的形式调用,您可以 在一切可以调用Com组件的开发语言中调用这一组件,快速的抽取各种文本内容。

Minidx是一个文件管理系统。它具有:
自带超高速全文搜索引擎,瞬间找到所需要的文件
具有自己的存储系统,安全的管理重要文档
可存储与管理TB级别的数据,数据量的大小对系统运行的效率影响甚微
采用IFilter抽取文本,无须安装例如Office的应用程序即可阅读内容
基于Unicode编码,可正常输入/显示多国语言
高亮语法显示,方便地阅读多种文档
检索结果高亮显示,方便查看
模糊查询,自动识别同义词 例如要查询where时,输入whe也能得到结果
自带Web服务器,可方便的在Internet/局域网共享所管理的文档
独立的P2P功能,可自由选择启动服务端/客户端,或者同时启动
可以根据创建时间,修改时间,访问时间,标题,存储路径,内容等各项属性分等级,分目录地实现精确查询
可方便设定过滤字段

搜索引擎特性:
整个引擎非常小,由2万多行C/C++代码实现
标准C/C++编写,几乎可以运行在所有的系统
无需太多内存,在较低的硬件环境下也可以运行而不影响效率
方便的集成到各种系统,利用Minidx引擎,仅仅需要添加几行代码就可以让系统具有全文检索功能
超高速检索,百万条记录也能在毫秒内返回结果
字,词,句检索
条件”与”,”或”查询,以及他们的组合查询
采用UNICODE字符集,多国语言字符串混合查询
精确查询,甚至一个标点符号也可以精确定位

  •   今天在寝室快熄灯的时候,找到了一个好东东 --Minidx,它是一个开源的文件管理程序,关于它的详细介绍参见 http://cn.minidx.com/index.php?option=com_frontpage&Itemid=1,好的,就写到这里,寝室快熄灯,洗洗睡了!!(快毕业了,马上就要结束这种晚上熄灯的学生生活了,呵呵,我想以后我会怀念的)

  • 由于安装office后 ,提出word,xls,ppt文件内容常报错,很烦恼,所有决定在不安装office前提下,或不调用 ole应用,进行文本提取,终于找到了 ifilter接口,国内研究该技术的代码和文档不多.所有我发布了代码 ,如何要转 rtf等格式的,要下载rtf Ifilter,默认支持以上三中,这样可以进行各种格式文件的搜索...

  • 来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11893231/viewspace-671878/,如需转载,请注明出处,否则将追究法律责任。 转载于:http://blog.itpub.net/11893231/viewspace-671878/

  • Flex的一个好的学习网站:http://blog.minidx.com/

 相关资料
  • 微信小程序中原生提供了selectComponent/SelectorQuery.select方法获取自定义组件实例和wxml节点信息,但是该api使用起来不太方便,并且不具备平台无关性,我们提供了增强指令wx:ref用于获取组件实例及节点信息,该指令的使用方式同vue中的ref类似,在模板中声明了wx:ref后,在组件ready后用户可以通过this.$refs获取对应的组件实例或节点查询对象(

  • 我有web服务JHipster API,我编写了Java代码来连接它,我知道JWT令牌有三个组件,来自JWT web站点https://JWT.io/ 首先解码 secound是有效载荷 我在这一部分的问题是我们如何知道JHipster API webserves中的sub、name和iat?

  • 接口说明 获取License信息 如需调用,请访问 开发者文档 来查看详细的接口使用说明 该接口仅开放给已获取SDK的开发者 API地址 GET /wish3dearth/api/access/v1.0.0/getLicenseInfo 是否需要登录 否 请求字段说明 无 响应字段说明 参数 类型 说明 hardwareComputerID number 许可码 RegistrationDate

  • 接口说明 获取License信息 如需调用,请访问 开发者文档 来查看详细的接口使用说明 该接口仅开放给已获取SDK的开发者 如开启https功能,请求地址的协议应改为https,如:https://www.example.com/wish3dearth/api/access/v1.0.0/getLicenseInfo API地址 GET /wish3dearth/api/access/v1.0.

  • 类通常对类的客户隐藏其实现细节,即所谓的信息隐藏。下列以堆栈数据结构作为信息隐藏的例子。 可以把堆栈看成一堆盘子。将盘子放在堆中时,总是放在顶部(压入堆栈),从堆中取下盘子时,总是从顶上取(称为弹出堆栈)。堆栈是后进先出(last-in,first-out;LIFO)的数据结构,最后放进堆栈的项目最先从堆栈中取出。 程序员可以生成堆栈类,对客户隐藏实现细节。堆栈可以方便地用数组实现(或用第15章“

  • 执行 gradle help —task someTask 可以显示指定任务的详细信息. 或者多项目构建中相同任务名称的所有任务的信息. 如下例. 例 11.12. 获取任务帮助 gradle -q help —task libs的输出结果 > gradle -q help --task libs Detailed task information for libs Paths :api