问题：

apache_beam.transforms.util.reshuffle（）不适用于GCP数据流

蓬高谊

2023-03-14

我已经通过PIP安装升级到最新的apache_beam[gcp]包--upgrade apache_beam[gcp]。但是，我注意到Reshuffle（）没有出现在[gcp]发行版中。这是否意味着我将不能在任何数据流管道中使用reshuffle()？有什么办法可以绕过这个吗？或者pip包可能只是不是最新的，如果Reshuffle（）在github的master中，那么它将在Dataflow上可用？

根据对这个问题的回答，我试图从BigQuery中读取数据，然后在将数据写入GCP存储桶中的CSV中之前对数据进行随机化。我注意到，我用来训练GCMLE模型的sharded.csv并不是真正随机的。在tensorflow中，我可以随机化批处理，但这只会随机化队列中构建的每个文件中的行，我的问题是当前生成的文件在某种程度上有偏差。如果有任何建议，以其他方式洗牌之前，写到CSV在数据流，这将是非常感谢的。

共有1个答案

朱岳

2023-03-14

一种方法是重新创建洗牌我自己。

import random

shuffled_data = (unshuffled_pcoll
        | 'AddRandomKeys' >> Map(lambda t: (random.getrandbits(32), t))
        | 'GroupByKey' >> GroupByKey()
        | 'RemoveRandomKeys' >> FlatMap(lambda t: t[1]))

我剩下的问题是，我是否需要担心代码中的窗口或expanditerable部分

类似资料：

JFreeChart数据集不适用于JPanel

更新：带有XYPlot的JPanel封装在JSplitPanel中。当我移动分隔符（用XYPlot放大JPanel）时，有两个XYPlot,第一个（在第一次单击时获得，第二个（如果第二次单击到另一个行/dataset->XYPlot）。
ng表不适用于动态数据

问题内容：我已经创建了一个表，并且正在使用http来加载表中的数据。因此，每次单击时，我的表数据都在变化，但是在表中看不到更新的数据。我创建了一个样本Plunker供参考。在我的项目中，当我单击“重新加载新数据”时，表中的数据已更改，但是在2-3次单击后，它没有更改。有人知道，如何解决它。问题答案： ngTable指令有问题。仅在更改时更新。看看这个pl。我将$ scope [‘tablePa
QueryDSL排序不适用于Spring数据

我目前正在使用带有Spring Data commons 1.9.1和Spring JPA 1.7.1的JpaSort。我需要使用QueryDSL，因为JPA不允许为空值定义排序。这是我的存储库我在我的控制器中这样做：这就是我对JPA的看法：这是我为QueryDSL更改的内容：然而，似乎什么都没有得到整理。我已经启用了调试日志记录，我看到了这一点：如果我将其更改为：然后，按我的“数据
NSS共享数据库不适用于SunPKCS11

我已经将NSS 3.12.4配置为在FIPS模式下使用SunPKCS11提供程序与我的java程序一起工作，一切都很好。现在我按照https://blogs.oracle.com/meena/entry/what_s_new_in_nss1中提到的步骤使NSS作为共享数据库工作。当我在共享数据库模式下配置NSS时，secmod.db文件会按预期替换为pkcs11.txt。但是现在SunPKCS1
SetState不适用于服务器中的数据

问题内容：嗨，我正在用React钩子编程一个页面，并且试图将从服务器获取的数据设置为状态。怎么它不起作用。我从服务器获取数据，但无法将其映射到状态。任何想法可能是什么问题？来自服务器的数据问题答案：是async方法，因此您将无法在其下获取更新的数据。否则您的代码是好的，如果您循环并显示它，它将反映在DOM中运行下面的代码片段，并检查HTML和console两者，这将清除流程。
“子集”不适用于drop_重复数据帧

我有一个df，看起来像这样：所需的输出如下所示：我试图删除基于列B的重复行。然而，当我运行时我得到以下错误：我正在从python 3运行pandas 0.19.1，因此我在这里查看了文档：http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html 对于，我没有最模糊的

apache_beam.transforms.util.reshuffle（）不适用于GCP数据流

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档