当前位置: 首页 > 知识库问答 >
问题:

AWS Cloudsearch可伸缩吗?

边浩漫
2023-03-14

我有500MB的数据要推送到云搜索。

以下是我尝试过的选项:

直接从控制台上传:

试图上传文件时,有5 MB的限制。

然后将文件上传到S3并选择S3选项,

上传到S3并在控制台中给出S3 url:

失败并要求尝试命令行。

尝试使用命令行

aws cloudsearchdomain上载文档--endpointurlhttp://endpoint--内容类型application/json--文档s3://bucket/cs。json

Error parsing parameter '--documents': Blob values must be a path to a file.

好的,将文件从s3复制到本地并尝试上传,

用本地文件和cli尝试:

aws cloudsearchdomain上载文档--endpointurlhttp://endpoint--内容类型应用程序/json--文档/反恐精英。json

在我们从endpointURL收到有效响应之前,连接已关闭:http://endpoint/2013-01-01/documents/batch?format=sdk".

要让CloudSearch工作吗?

共有1个答案

江承嗣
2023-03-14

据我所知,这并不是关于Cloudsearch根据问题标题的可伸缩性,而是关于上传的限制,以及如何将大文件上传到Amazon Cloudsearch。

最佳解决方案是通过分块上传数据。将您的文档拆分为多个批次,并批量上载数据。(但请记住相关的限制)

这样做的好处是,如果要提交多个文档,请在一次调用中提交所有文档,而不是总是提交大小为1的批。AWS建议分组(最多5MB)并发送一个电话。我认为,每1000次通话需要花费你0.10美元,所以分组也能为你节省一些钱。

这对我有用。下面给出一些指导方针来帮助更好地解决这个问题。

将数据上传到Amazon Cloudsearch时要遵循的指导原则。

>

  • 在上传文档之前,将文档分组。持续上传只包含一个文档的批对Amazon CloudSearch处理更新的速度有巨大的负面影响。相反,创建尽可能接近限制的批次,并减少上传频率。(限制如下所述)

    要将数据上载到域,必须将其格式化为有效的JSON或XML批处理

    现在,让我解释一下亚马逊云搜索与文件上传相关的限制。

    1) 批量大小:

    最大批量大小为5 MB

    2) 文件大小

    最大文档大小为1 MB

    3)文档字段

    文档的字段不能超过200个

    4) 数据加载量

    您可以每10秒加载一个文档批(大约每24小时加载10000批),每个批大小最多为5MB。

    但如果你想增加限制,可以联系亚马逊CloudSearch。目前,亚马逊不允许增加上传大小限制。

    如果需要增加搜索域的最大分区数,可以提交请求。有关增加搜索域最大数量等其他限制的信息,请联系Amazon CloudSearch。

  •  类似资料:
    • 伸缩是对该应用所启动的pods数量进行一个控制。 同样进入应用的详情页页,在右上角找到“伸缩”按钮并点开。 在弹出来的对话框中选择启动的POD数量,如下图: 提交之后若数量大于之前的数量,则会启动缺少的POD数量,若小于之前的值,将会逐步减少应用的POD。 目前给的最大值是8个pod,资源可使用的内存是16G,若您的应用超过我们所设定的最大值。想办法优化吧,64核128G内存都不够用,这种级别的应

    • 我正在尝试设置2个支持HA和故障转移的ActiveMQ Artemis服务器。但是在文档和本例中,我可以看到Artemis是不可伸缩的,因为我必须在代码中设置到每个Artemis节点的连接和会话。这意味着,如果我想通过添加第三个服务器来扩展Artemis,那么我必须发布一个新的代码,其中存在与该服务器的连接和会话,对吗?

    • 我正在尝试创建一个带有可伸缩列的动态html表。在实际情况下,我可以有20列每个标题和最多400个值。我想这样呈现数据: 我希望能够点击和colx.1,展开或显示同一标题下的所有列,折叠(或隐藏)其他标题的其他列。在上表中单击任何COL2.1单元格,然后将该表更改为: 我试着做了这样的事情:在所有可以显示/隐藏的td元素上使用hideable类,并且做了这样的事情: 我还需要相应地更改页眉和页脚的

    • 在我工作的公司,我们计划更新和重新编码我们12年的在线销售网络应用程序。 我们的客流量有点高;每天超过10万个销售订单意味着在web应用程序上每天至少有100万个交互。 我想用NodeJS作为web服务器,集成到我们的ERP系统中,运行在Oracle Exadata数据库上。 我的问题是:性能对我们来说是非常非常关键的,我不确定NodeJS的可伸缩性是否足以应付如此高的事务数。 我在网上读了一些博

    • 本文向大家介绍可伸缩的textview详解(推荐),包括了可伸缩的textview详解(推荐)的使用技巧和注意事项,需要的朋友参考一下 在Android原生的TextView的基础上,可收缩/扩展的TextView:PhilExpandableTextView。 实现原理:核心是控制TextView的max lines。在TextView的初始化阶段但尚未绘制出View的时候,使用ViewTree

    • 在本教程之后,我遇到了Trie数据结构。因为最近我一直在用PHP编程,所以我试图用它来解决讲座中的问题。我能够获得正确的答案,但只适用于较小的输入(输入#10是一个2,82 MB的文件)。显然,我的算法缩放不好。它还超过了PHP默认的128 MB内存限制。 Trie中存储了一个根节点。每个节点都有一个“子”成员。我使用标准PHP数组来存储子对象。子键表示一个字符(目前我正在为每个字符创建一个新节点