当前位置: 首页 > 知识库问答 >
问题:

在分区上用列点燃dataframe

曾德水
2023-03-14

dataframe中的列“Cola”包含整数值:

+-----+
| colA|
+-----+
|    1|
|    2|
|    1|
|    3|
+-----+

这些整数值可以通过Redis字典映射到字符串:

+----+------+
| key| value|
+----+------+
|   1|     a|
|   2|     b|
|   3|     c|
+----+------+

我需要创建一个新列“colb”,它将包含“cola”到字符串值的映射:

+-----+-----+
| colA| colB|
+-----+-----+
|    1|    a|
|    2|    b|
|    1|    a|
|    3|    c|
+-----+-----+
    null

共有1个答案

慕容典
2023-03-14

请注意,我希望避免以下开销:

  • ...
  • 通过直接调用DataFrame上的mapPartitions来关联编码器。

这实际上使它变得不可能。任何不使用SQL DSL的操作都需要解码为外部类型并编码回内部类型。对于原始值,如果使用二进制编码器,它是低成本的操作,但它仍然需要编码器

 类似资料:
  • 我是Apache Ignite的新手,我们的要求是在docker上运行它,但是,我尝试在网上搜索如何从我的C#.NET应用程序连接到dockerize Apache Ignite,但是没有找到关于这方面的好资源。 我运行docker-compose up,Apache Ignite正在运行。但是,我不知道如何从我的C#代码连接到这个dockerized ignite。请让我知道如何这样做,如果你可

  • 我有一个tomcat用ignite进行会话聚类。我有一个示例登录调用,它为一个用户创建一个会话,在成功登录之后,我看到下面的日志打印出来,其中堆大小波动很大。 我的问题是 为什么整个堆大小是波动的?。 感谢任何指点。 问候你,阿拉温德

  • 我正在寻找apache ignite授权示例。但我在网上找不到。如果你们中的任何一个已经实现了点火授权,那么请告诉我如何执行授权。

  • 我试图使用JPA规范编写以下查询。从hcp中选择Distincent name,其中区域='Dhaka'; hcp实体如下所示 桌子应该是这样的 所需的结果将根据区域列出不同的名称。如何使用JPA规范在特定字段上应用distinct? 所需的查询和输出:

  • 我们有一个包含2个数据节点和分布式缓存的cluste(IgniteV2.7)。 我们将数据加载到这个缓存中,并开始海量读/写操作。集群工作得很好。根据JMX,StripedExecutor队列为空。 数据区域配置: 缓存配置:

  • 我有Ignite2.7和5节点集群。超过40Mil的数据正在生成并存储在ignite缓存中。我已经设定了3天的有效期。今天其中一个点火节点停止了,并显示如下错误。请帮助我确定并解决这个问题。 [2019-09-11 07:45:59,570][错误][TTL-Cleanup-Worker-#170][根]检测到严重系统错误。将根据配置的处理程序[hnd=stopnodeorhaltfailureh