openDIAS

文档扫描和存储工具
授权协议 GPLv2
开发语言 C/C++
所属分类 应用工具、 文档/文本编辑
软件类型 开源软件
地区 不详
投 递 者 慕容恩
操作系统 Linux
开源组织
适用人群 未知
 软件概览

openDIAS (Document Imaging Archive System) provides document imaging with OCR. You can scan documents (with SANE) or import office documents, then assign them tags. It can store all your letters, bills, statements, etc. in a convenient, safe, and easily retrievable way

主要特性:

  • Scan documents (SANE). Extract the text (OCR), and use for searching or export.

  • Import PDF, ODF and Image files, extract images and text from these as well.

  • Assign tags to docs, link docs to each other, zoom in, export and print docs.

  • Auto detect similar documents, the application can offer to 'tag' and 'title' new docs for you.

  • Application is accessible from any HTTP browser, and secured behind usernames and passwords.

  • Application is fully localisable (currently localised into English, German and Dutch).

  • Published API that is fully tested.

 相关资料
  • 我正在使用DynamoDB,并通过将JSON传递给它来存储文档,所有这些都在Java中使用DynamoDBMapper类。 将数据放入表中已经足够简单了。还可以查询表中是否有可用的Hash或Range值。 但是我想用JSON文档对一个值进行扫描(我猜是这样)。我一直在四处寻找例子,但我找不到任何例子,或者至少在使用DynamoDBMapper方法做事时找不到。 那么我认为这是可以做到的,对吗?如果

  • 我正在使用存储访问框架将图像下载到外部sd卡。问题是这些图像不会出现在图库中。我试图通过发送DocumentFile uri来通知Android媒体扫描仪使用意图,但这似乎不起作用。下面是我如何尝试通知媒体扫描器添加了新图像: 有没有其他方法来通知Android添加了新图像?(我已经尝试了这里描述的方法,但我无法使用这些方法获得真实路径)

  • 问题内容: 我正在尝试寻找一种方法来打破已自适应阈值的扫描文档中的文本行。现在,我将文档的像素值存储为0到255之间的无符号整数,并获取每行像素的平均值,然后根据像素值的平均值是否为0将行划分为多个范围大于250,然后将其取为各行范围的中值。但是,此方法有时会失败,因为图像上可能会出现黑色斑点。 有没有更好的抗噪方法来执行此任务? 编辑:这是一些代码。“扭曲”是原始图像的名称,“剪切”是我要分割图

  • 我已经做了很多关于这个主题的研究,但我发现的一切都是每次“使用的函数getOverContent的压模”。我做了这个,但还是不行。 我做了一个程序,合并在一起的PDF的汇编,然后它分页这个新的文件(我希望你可以跟随我写的)。原始PDF是自制的(直接保存在PDF中)或不是(扫描)。这是最后几个有麻烦的地方。分页显示在第一个,但不是在秒(它可能存在,但它应该在图像后面)! 这里是分页的代码,有人知道我

  • 问题内容: 我试图在一个小型独立应用程序中一起使用spring数据和spring config。 1. 我的问题是如何在不使用Spring的情况下发现spring数据存储库 通过spring config? 2. 如果没有,我可以以某种方式一起使用“ ClassPathXmlApplicationContext”和“ AnnotationConfigApplicationContext”吗? 问题

  • 我有一个扫描仪,它读入字符串作为坐标输入。我必须将这些字符串转换成整数,并将它们存储在坐标的Arraylist中,但我输入的最后一个值没有存储在Arraylist中。 我尝试在for-loop之外使用,但仍然没有变化。在存储和解析字符串时,我也尝试使用while循环而不是for循环,但得到了相同的结果。 预期结果: 点:[1,2,3,4] 实际结果 点:[1,2]