当前位置: 首页 > 知识库问答 >
问题:

在Google Cloud Vision API OCR中设置图像检测区域

赵嘉悦
2023-03-14

我曾使用谷歌云视觉API进行文档文本检测,但我不知道它是否允许我们定义一个特定的图像区域来提取文本。例如,如果我的图像有3列文本,我想提供左上角坐标、要执行OCR的特定列的宽度和高度。可能吗?还有,当我们在图像中有3列文本时,有没有其他方法不让文本变得混乱?

共有2个答案

裴永年
2023-03-14

可以围绕Detector类构建自己的包装器类。然后在帧对象中重新构建位图,该帧对象被送入检测方法。

孔寒
2023-03-14

目前,无法定义要从中提取文本的特定图像区域。REST或gRPC API中的图像上下文中都没有可用的参数。一种可能的解决方法是裁剪图像,只发送想要转录的文本。如果您想尝试自动化此过程,可能需要使用对象定位或裁剪提示功能。

对于混乱的文本,您可以在Json响应中找到每个块或段落。

 类似资料:
  • 我需要帮助来识别边界,并将图像与原始图像进行比较。我需要指导如何我可以实现这通过处理或matlab或任何初学者。例如,请看下面的图像。 原始图像:

  • 我正在为我的项目创建一个基础图像。在这个基础图片中,我将下载一些。焦油gzs并提取它们。 我想将这些解压缩的目录添加到路径中,因此在子图像中,我可以直接调用下载的可执行文件,而无需指定完整路径。 我试着运行导出路径 在基本图像中,但这似乎不起作用(至少当我进入它时,我没有看到路径更新,我假设是因为导出没有转移到新的bash会话中)。 还有其他方法吗?我应该编辑吗。bashrc?

  • 我设计了一个简单的表格。 其中我将一个面板作为contentPane,将一个JLabel作为LBLPanel。 但是当我尝试这样做时,它只显示图像的原始大小,这是自然的,我们必须手动设置图像大小来fed整个JLabel。 因此,下面是我使用JLabel的图标属性设置图像时由WindowBuilder生成的代码。 现在我的问题是我想把图像的大小设置为JLabel的大小,那么有什么直接的方法可以使用W

  • 问题内容: 在NetBeans上运行时,以下代码可以正常工作。 但是,一旦将其内置到Jar文件中,该图标就消失了。 任何人都知道出什么问题了吗?我意识到我必须将图标图像放在根目录中,但是,在编译为JAR之后,图标消失了。 谢谢你的帮助 … 大家好,以下代码解决了这个问题, 一旦编译成jar文件,它就可以工作。 问题答案: 用 代替。 注意: 仅当图像位于jar文件的根目录中时,此行才有效。如果不是

  • 我正在为Waze开发开源JavaScript插件——著名的免费GPS导航器——专门为在线编辑器开发。这个用户脚本的想法是可以快速选择大的统一颜色的地图区域,将它们转换为地标。 到目前为止,我已经成功地在Photoshop这样的图形编辑器中实现了一个你称之为“魔杖”的工具:用户点击地图上的某个地方(比如,在湖泊或森林上),脚本选择相同颜色覆盖的整个区域,并为地标创建一个多边形。 一切都很好,除了我使

  • 我想知道如何使用OpenCV在我的摄像机上检测图像。该图像可以是500个图像中的一个。 我此刻正在做的事: 我想要检测的图像是2-5KB小的。很少有人在上面发短信,但其他的只是一些迹象。这里有一个例子: 你们知道我怎么做吗?