当前位置：首页 > 专题 >

《欢聚集团》专题

Spark SQL中按日期分组聚合
问题内容：我有一个包含时间戳名为RDD 时间长整型：我正在尝试按值1，值2和时间分组为YYYY-MM-DD。我尝试按演员分组（时间为日期），但随后出现以下错误：这是否意味着无法按日期分组？我什至尝试添加另一级别的强制转换以将其作为字符串：哪个返回相同的错误。我已经读到我可以在RDD上使用gregationByKey，但我不明白如何在几列中使用它并将其转换为YYYY-MM-DD字符串。我
事件源中的多聚合事务
我是事件采购的新手，但对于我们当前的项目，我认为这是一个非常有前途的选择，主要是因为审计跟踪。有一件事我不是100%满意，那就是缺乏跨聚合的超越。请考虑以下问题：我有一个订单，它在不同的机器上处理，在不同的车站。我们有集装箱，工人们把订单放进去，然后把它从一台机器运到另一台机器。必须通过容器（具有唯一的条形码id）进行跟踪，订单本身无法识别。问题是：容器是重用的，需要锁定，因此没有工作人员可
CompletableFuture——快速失败的聚合未来
我一直在使用助手来创建聚合期货，只有当它们的复合期货被标记为完成时才会成为“完成”，即：我想对这一功能稍作改动，在以下情况下，总的未来市场是完整的：所有期货均已成功完成或在后一种情况下，总期货应立即完成（例外），而不必等待其他期货完成，即快速失败。对比
响应中返回的空Elasticsearch聚合
但邮差回信说：知道为什么或如何进一步调试它吗？Spring data-elasticsearch在做我不明白的事情吗？我应该期待这样的事情：
分类值上的elasticsearch排序聚合
在elasticsearch中，我可以在第二个聚合的数字字段上聚合和排序聚合。例如。但是，我想根据分类字段值对聚合进行排序。也就是说，字段2的值是（“a”、“b”、“c”）中的一个值——我想首先按所有文档对a1进行排序，字段2为：“a”，然后字段2为“b”，最后字段2为“c”。在我的例子中，每个字段1都有一个唯一的字段2。所以我真的只想找到一种方法，按字段2对a1结果进行排序。
增加或减少聚合的分区？
我不确定在进行聚合操作时应该增加还是减少分区数量。假设我正在使用pyspark数据框架。。我知道行转换通常需要更多的分区。而将数据保存到磁盘通常需要fewere分区。但是，对于聚合，我不清楚在中做什么？？增加分区数的参数：由于我们必须为聚合而洗牌数据，因此您希望洗牌更少的数据，从而增加分区数，以减小分区的大小。减少分区数量的论点：IT需要大量开销来收集和计算每个分区。因此，太多的分区将导致
弹性搜索桶词复合聚合
这是我的示例文档，我在kibana的帮助下为类似文档编制索引。现在在文件中，“体验”下的关键“品牌”是主集团“公司”的子集团。正如您在文档中看到的，“品牌”可能有类似于“其他”的条目，但由“公司”键分隔。类似的结构可以在文档内部和文档之间出现。我打算根据“品牌”和“公司”来汇总文档。我尝试的查询是- 我得到的错误为- 这是我的文档的映射- 我知道我的经验字段没有嵌套，可能是这个错误的原因。我对e
Elasticsearch桶聚合返回错误的doc_count
我正在使用Elasticsearch bucket聚合。我有一组文档，每个文档都有一个类别字段，它是一个数组。我需要获得每个类别的数量以及搜索结果。但目前，我得到了错误的doc\u计数。这是我的聚合查询 } 下面是我得到的错误doc\u计数的结果。
MongoTemplate聚合返回“IllegalArgumentException：无效引用”
给定具有以下文档的集合：假设有更多的这些文档带有其他“resource-id”值，我希望返回我之前键入的同一个文档，但是“mappings”数组只包含version-tag=X的对象，“address-aggregations”数组只包含[pidx,pidy,...]中带有“pid”的对象。我目前能想到的最好的方法是以下聚合管道：它在mongodb客户端shell上返回了预期的结果。但是，当我
$Project MongoDB聚合中的非重复项
我在mongodb中有一个非常大的项目集合，其模式无法更改。简化版的样子是这样的：集合非常大，我无法首先提取应用程序中的所有ip地址，然后计算每个ip地址的事件。这能用地图/缩小吗。你有什么建议？
DDD CQRS中聚合的读取模型
在CQRS ES和DDD中，聚合中的小读模型从其他聚合或有界上下文中获取数据是件好事吗？例如，在订单验证（订单聚合）中，有一个业务规则，该规则仅在未标记客户时验证订单。标志信息通过同步域事件放入读取模型（特定于聚合）。你怎么看？
来自数据库的聚合速率
我在MongoDB有一个收藏。模型是：任何时候货币变化的官方汇率都会将文件记录在该集合中。我得到了一个时间戳，我需要获取当时所有可用货币的汇率。因此，首先我需要过滤所有需要时间$lte的文档，然后我只需要获取那些具有最大时间戳的文档。每种货币。
SQL_MODE=mysql的only_full_group_by的非聚合列[duplicate]
SQL在sql_mode=ONLY_FULL_GROUP_BY中遇到了一些问题，如何重写这个SQL？
API网关中的数据聚合-Zuul
我正在寻找一种在API网关中提供某种数据聚合的解决方案。我正在使用SpringCloudNetflixZuul作为API网关。我使用SpringBoot创建了3个微服务- 这里是Zuul配置- 在产品详细信息页面中，我需要打两个电话- 有没有办法对API网关进行一次调用，将上述两次调用的结果结合起来？这两个调用都给出JSON作为响应。
kafka streams groupBy聚合生成意外值
我的问题是关于Kafka的。群比。总数的以及由此产生的聚合值。我正试图每天汇总每分钟的事件。我有一个分钟事件生成器（此处未显示），为一些房屋生成事件。有时事件值错误，必须重新发布分钟事件。分钟事件发表在话题“分钟”中。我正在使用kafka Streams和对每天和每家每户的这些事件进行汇总。通常，由于一天有1440分钟，因此聚合值不应超过1440。此外，不应存在事件量为负值的聚合。 ...

首页

39

40

41

42

43

44

45

46

47

尾页

最新发布

飞猪搜广推二面凉经小米汽车深度学习训练框架优化面经中国移动研究院，AI并行训练面经华为：AI工程师面经 Construct 推荐算法实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

使用vs2022编辑c++程序时，程序报错并退出，代码0xc0000279，求助！？amh - 请问AMH面板不能访问服务器根目录吗？前端 - 为什么CSS transform: translate(-160px) 实际测量结果为240px？vue3 使用什么 vscode 插件？css - 怎么去掉聚焦文字处的光标竖线？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

CYRKeyboardButton Ubuntu Tweak Piston Press and Hold Button Pipx SCheckbox rbfEditor AurigaDoc

文档资料

Aurelia 中文教程 Java Web 从入门到精通 Apache Groovy 中文教程 FullCalendar 中文文档 ionic 2.0 文档中文翻译