问题：

在Google Cloud Vision API OCR中设置图像检测区域

赵嘉悦

2023-03-14

我曾使用谷歌云视觉API进行文档文本检测，但我不知道它是否允许我们定义一个特定的图像区域来提取文本。例如，如果我的图像有3列文本，我想提供左上角坐标、要执行OCR的特定列的宽度和高度。可能吗？还有，当我们在图像中有3列文本时，有没有其他方法不让文本变得混乱？

共有2个答案

裴永年

2023-03-14

可以围绕Detector类构建自己的包装器类。然后在帧对象中重新构建位图，该帧对象被送入检测方法。

孔寒

2023-03-14

目前，无法定义要从中提取文本的特定图像区域。REST或gRPC API中的图像上下文中都没有可用的参数。一种可能的解决方法是裁剪图像，只发送想要转录的文本。如果您想尝试自动化此过程，可能需要使用对象定位或裁剪提示功能。

对于混乱的文本，您可以在Json响应中找到每个块或段落。

类似资料：

在单个图像中检测多个图像

我需要帮助来识别边界，并将图像与原始图像进行比较。我需要指导如何我可以实现这通过处理或matlab或任何初学者。例如，请看下面的图像。原始图像：
在docker图像中设置$PATH？

我正在为我的项目创建一个基础图像。在这个基础图片中，我将下载一些。焦油gzs并提取它们。我想将这些解压缩的目录添加到路径中，因此在子图像中，我可以直接调用下载的可执行文件，而无需指定完整路径。我试着运行导出路径在基本图像中，但这似乎不起作用（至少当我进入它时，我没有看到路径更新，我假设是因为导出没有转移到新的bash会话中）。还有其他方法吗？我应该编辑吗。bashrc？
无法在JLabel中设置图像

我设计了一个简单的表格。其中我将一个面板作为contentPane，将一个JLabel作为LBLPanel。但是当我尝试这样做时，它只显示图像的原始大小，这是自然的，我们必须手动设置图像大小来fed整个JLabel。因此，下面是我使用JLabel的图标属性设置图像时由WindowBuilder生成的代码。现在我的问题是我想把图像的大小设置为JLabel的大小，那么有什么直接的方法可以使用W
在Jar文件中设置图标图像

问题内容：在NetBeans上运行时，以下代码可以正常工作。但是，一旦将其内置到Jar文件中，该图标就消失了。任何人都知道出什么问题了吗？我意识到我必须将图标图像放在根目录中，但是，在编译为JAR之后，图标消失了。谢谢你的帮助 … 大家好，以下代码解决了这个问题，一旦编译成jar文件，它就可以工作。问题答案：用代替。注意：仅当图像位于jar文件的根目录中时，此行才有效。如果不是
地图图像中“凹壳”的检测

我正在为Waze开发开源JavaScript插件——著名的免费GPS导航器——专门为在线编辑器开发。这个用户脚本的想法是可以快速选择大的统一颜色的地图区域，将它们转换为地标。到目前为止，我已经成功地在Photoshop这样的图形编辑器中实现了一个你称之为“魔杖”的工具：用户点击地图上的某个地方（比如，在湖泊或森林上），脚本选择相同颜色覆盖的整个区域，并为地标创建一个多边形。一切都很好，除了我使
OpenCV根据图像集检测图像

我想知道如何使用OpenCV在我的摄像机上检测图像。该图像可以是500个图像中的一个。我此刻正在做的事：我想要检测的图像是2-5KB小的。很少有人在上面发短信，但其他的只是一些迹象。这里有一个例子：你们知道我怎么做吗？

在Google Cloud Vision API OCR中设置图像检测区域

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档