当前位置: 首页 > 知识库问答 >
问题:

Tesseract Set变量tessedit_char_whitelist在另一种语言

洪季萌
2023-03-14

Tesseract setVariable白名单适用于英语,例如,我使用它仅识别图像中的数字和字母(不包括特殊字符)

_ocr.SetVariable("tessedit_char_whitelist",
"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");

但我不能对泰语做同样的事

_ocr.SetVariable("tessedit_char_whitelist","0123456789กขคงจฉ");

有不同的原则吗?因为这不起作用。tesseract忽略我输入到白名单中的所有泰语字母,而不是输出中只接收数字的所有确定字符。

如何正确传递此变量?

共有1个答案

阎星华
2023-03-14

您可能需要先使用泰语语言包...请参考这里的下载列表https://code.google.com/p/tesseract-ocr/downloads/list

然后,您需要在代码中将“eng”替换为“tha”,以便将新的语言数据用于OCR

 类似资料:
  • 可能重复: Java中的动态变量名: 假设我有一个字符串,如下所示。 现在,我想创建一个字符串,但是字符串的变量将被称为“Hello”。为了使字符串名为“Hello”,我必须访问string以获取名称“Hello”,这样我就可以将其用作变量名。下面是我想看的。 感谢您的努力,请尝试向我解释,因为我是Java初学者D

  • 我必须将所有产品的正常价格和销售价格(超过10000)从美元改为印度卢比。客户希望所有的价格都应该通过乘以64.72(当前美元对印度卢比的汇率)以印度卢比转换。它是在产品创建期间以美元输入的。但是现在客户坚持从各地换成INR 请注意,更改数据库中的原始价格是必须的,我们没有使用任何货币转换工具来显示使用转换工具的最终用户。 例如,假设产品价格为100美元,现在批量更新后,数据库中的价格也应为647

  • 我有2个mysql语句,其中一个从4个链接表中获取所有信息,供员工使用。我正在尝试为另一个表中的每个staff member获取标题,但我无法将其添加到1语句中,因为它与所选的主表无关。我已经尝试了mysql语句的20个变体,但都没有成功。我确实让它通过第二条语句中的一个变量拉出标题并输出它,但它给每个语句都赋予了相同的标题,当它再次循环时似乎并没有更新变量。 第一条mysql语句读到(简化版很长

  • 问题内容: 我在Javascript中有一组全局计数器变量: 等等 然后,我有了一个Javascript函数,该函数接受一个映射到这些全局计数器的“索引”数字。在此函数内部,我需要使用传递给该函数的“索引”值来读写这些全局计数器。 我希望它如何工作的示例,但当然根本不起作用: 我希望我要实现的目标是明确的。如果没有,我会尽力澄清。谢谢。 编辑说明: 我不是要增加计数器的名称,而是要增加计数器包含的

  • 问题内容: 我想对Java变量进行动态转换,转换类型存储在其他变量中。 这是常规转换: 这就是我要的: 这有可能吗?谢谢! 更新资料 我正在尝试使用HashMap收到的A 填充类。 这是构造函数: 这里的问题是某些类的变量的类型是,如果接收到数字3,它会认为它是类型问题。 问题答案: 是的,可以使用反射 但这没有多大意义,因为必须将结果对象保存在类型变量中。如果你需要变量属于给定的类,则可以将其强