我正在尝试处理我用tesseract录制的黑板图像,但运气不好。我想过做预处理来帮助提高我们的结果,但不确定该用什么方法来调用它。
这是我拥有的图像:
下面是我正在运行的< code>tesseract命令:
convert 468.jpg -bordercolor black -border 20x20 468-b.jpg
tesseract 468-b.jpg - -psm 11
请注意,它不必正确处理所有数学符号,但至少要得到1 4 = 5
,也许得到2 x 12 = 24 x 1
。
我以前有一张照片,只用这些命令就能很好地工作。照片如下:
下面是它会产生的结果:
I+I
2+2m
这并不完美,但比我以前得到的要好得多。如何提高新黑板图像的效果?我需要使用OpenCV吗?如果需要,一个示例实现将非常非常有用
预先感谢
P.S.这是我在Tesseracts GitHub上提出的最初问题,它让我得到了更好的结果:
https://github.com/tesseract-ocr/tesseract/issues/468
tesseract不能很好地识别手写图像。所以我认为你应该使用深度学习来识别手写图像。
这里有一些你感兴趣的教程。
https://www . tensor flow . org/versions/r 0.12/tutorials/Mn ist/初学者/index . html # Mn ist-for-ml-初学者
我们正在使用Tess4J/Tesseract在webapp上执行OCR。在Windows上一切正常,但当部署在Linux机器(CentOS 6.8)上时,程序崩溃并自动杀死Apache tomcat服务器。 我们读取了多个文件(不同的文件)simultaneously.if我们运行OCR它运行大约1分钟后它通过致命错误。你能建议如何解决吗? Java运行时环境检测到致命错误: 在pc=0x0000
在我的Java应用程序中,我想从图像中提取文本。我下载了谷歌的Tesseract OCR,并将其安装在我的Windows XP机器上。我遵循了Tesseract的教程Tess4J-JNA包装器,不幸的是出现了这个错误: 我在StackOverFlow中发现了类似的问题,但似乎没有任何效果。我希望你能帮我解决这个问题! 下面是我在Netbeans IDE 7.2中的项目结构:
60min,算法我用穷举做的,不会动归,面试官面露难色😂😂面试官人很好,我忘了可能导致ThreadLocal内存泄露的原因,面试官会尝试引导我去理解和推断。 项目 用过哪些分布式组件,介绍功能以及怎么用的 介绍了解过的限流算法并做比较 Sentinel怎么实现熔断与降级的 比较Synchronized与Lock,并介绍他们的粒度 线程池参数 ThreadLocal实现机制与内存泄露问题 可达性
群友内设 40分钟 1.聊项目 项目hook 路由 useContext优化 2.vite和webpack打包的区别 3.最近在怎么样学前端 3.setState之后做了什么 说源码,调度器和更新队列 4.说一说函数执行上下文 this 5.说说es6有啥 6.小程序的底层架构 简历上写了但是很久没些小程序,结果他们心识最近就是在做小程序 没什么好说的,问的比较随意,因为是内设而且心识缺人,快冲
我们有一个使用MongoDB连接器v3.1的环回v3.8应用程序,它在运行本机MongoDB的环境中工作正常,但现在我们想部署到Azure并使用宇宙数据库,理论上应该支持所有本机MongoDB命令。 我们面临的问题是修补程序操作(我相信通过环回映射到Model.updateAttribute)不起作用。这是我们得到的错误: 无法更新客户端。{错误:未找到id为592cc132a31109354c4
上来两道算法:波兰国旗+快排 吐槽:这一周一直忙着期末考试,算法一点没刷,早忘光了,33分钟一道a出来,我就知道完了。 正文: 1. 介绍一下你的项目 2. 点赞功能怎么实现的(指出了项目中通过RabbitMQ将点赞数发送到对应的各个业务模块的方案不可取,有道理) 3. MQ的特性 4. 消息消费失败怎么办 5. 对Redis的了解 6. Redis的持久化机制 面试官人很好,很有耐心,奈何自己太