我使用这个API来进行测试https://cloud.google.com/vision/docs/ocr测试引擎。
请求机构:
{
"requests": [
{
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"image": {
"source": {
"imageUri": "https://i.stack.imgur.com/3wwYp.jpg"
}
}
}
]
}
结果就是
{
"responses": [
{}
]
}
我错过什么了吗?非常感谢。
您可能想尝试其他功能。例如
"type": "TEXT_DETECTION"
您可以尝试根据文档设置“model”:“builtin/latest”,这将为您提供一些结果。我相信识别垂直文本是目前正在进行的工作,所以现在你不应该期望100%的准确率。
另一个问题是Vision API目前不支持单字符检测。这里有一个关于字符识别的功能请求。请将其标记为星形,以便您可以收到有关此功能请求的更新,并毫不犹豫地添加其他注释,以提供所需实现的详细信息。
你也可以看看这篇文章,人们在这里讨论垂直文本识别。
我用你的图像尝试了我的第一个建议,由于某种原因,A没有被识别,可能Vision API认为它与其他字母“分离”,这些字母形成了一个序列,并且没有被识别,因为在这种情况下,它被视为一个字符。
我是谷歌API的新手。最近,我使用了Google Vision API,但遇到了以下问题: 我尝试了“创建服务帐户”的解决方案,以生成服务json键并在py中调用它。脚本,它将在几乎3~4个url中首先工作,但在下一个url中会出错。这是我的检测代码: 我在另一个py中调用“detect.py”。脚本:
我正在尝试使用Google Cloud Vision API来检测图像中的文本,我遵循了以下教程中的代码:https://cloud.google.com/vision/docs/fulltext-annotations 完整代码如下: 我将Windows 10与Python 3.7一起使用,并在命令提示符中使用以下代码: 我得到了以下错误和回溯: 我已经浏览了以前关于这个错误的帖子,但我不知道这
我想从谷歌云视觉应用编程接口中获取数据,并看到输入可以以Base64和图像uri格式给出。但是Base64似乎太长了,以uri上传图像需要一些额外的时间。请让我知道,如果有人知道这方面的任何其他工作。
我正在尝试Google Cloud Vision API(测试版),它返回“权限被拒绝”消息。但该项目启用了“云视觉API”。感谢您的帮助。 谷歌API浏览器中的错误详细信息
我正在使用谷歌云视觉应用编程接口来搜索类似的图像(网络检测),它工作得很好。谷歌检测完全匹配的图像和部分匹配的图像(裁剪版本)。 我正在寻找一种方法来检测更多不同的版本。例如,当我寻找一个标志时,我想检测这个标志的大、小、方形、矩形...版本。目前,我检测到与我上传和裁剪版本完全匹配的图像。 你知道这是否可能,我该怎么做?