当前位置: 首页 > 知识库问答 >
问题:

使用谷歌云视觉识别垂直文本

陈正业
2023-03-14

我使用这个API来进行测试https://cloud.google.com/vision/docs/ocr测试引擎。

请求机构:

{
  "requests": [
    {
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "image": {
        "source": {
          "imageUri": "https://i.stack.imgur.com/3wwYp.jpg"
        }
      }
    }
  ]
}

结果就是

{
  "responses": [
    {}
  ]
}

我错过什么了吗?非常感谢。

共有2个答案

白阳煦
2023-03-14

您可能想尝试其他功能。例如

"type": "TEXT_DETECTION"
陆涵畅
2023-03-14

您可以尝试根据文档设置“model”:“builtin/latest”,这将为您提供一些结果。我相信识别垂直文本是目前正在进行的工作,所以现在你不应该期望100%的准确率。

另一个问题是Vision API目前不支持单字符检测。这里有一个关于字符识别的功能请求。请将其标记为星形,以便您可以收到有关此功能请求的更新,并毫不犹豫地添加其他注释,以提供所需实现的详细信息。

你也可以看看这篇文章,人们在这里讨论垂直文本识别。

我用你的图像尝试了我的第一个建议,由于某种原因,A没有被识别,可能Vision API认为它与其他字母“分离”,这些字母形成了一个序列,并且没有被识别,因为在这种情况下,它被视为一个字符。

 类似资料:
  • 我是谷歌API的新手。最近,我使用了Google Vision API,但遇到了以下问题: 我尝试了“创建服务帐户”的解决方案,以生成服务json键并在py中调用它。脚本,它将在几乎3~4个url中首先工作,但在下一个url中会出错。这是我的检测代码: 我在另一个py中调用“detect.py”。脚本:

  • 我正在尝试使用Google Cloud Vision API来检测图像中的文本,我遵循了以下教程中的代码:https://cloud.google.com/vision/docs/fulltext-annotations 完整代码如下: 我将Windows 10与Python 3.7一起使用,并在命令提示符中使用以下代码: 我得到了以下错误和回溯: 我已经浏览了以前关于这个错误的帖子,但我不知道这

  • 我想从谷歌云视觉应用编程接口中获取数据,并看到输入可以以Base64和图像uri格式给出。但是Base64似乎太长了,以uri上传图像需要一些额外的时间。请让我知道,如果有人知道这方面的任何其他工作。

  • 我正在尝试Google Cloud Vision API(测试版),它返回“权限被拒绝”消息。但该项目启用了“云视觉API”。感谢您的帮助。 谷歌API浏览器中的错误详细信息

  • 我正在使用谷歌云视觉应用编程接口来搜索类似的图像(网络检测),它工作得很好。谷歌检测完全匹配的图像和部分匹配的图像(裁剪版本)。 我正在寻找一种方法来检测更多不同的版本。例如,当我寻找一个标志时,我想检测这个标志的大、小、方形、矩形...版本。目前,我检测到与我上传和裁剪版本完全匹配的图像。 你知道这是否可能,我该怎么做?