当前位置: 首页 > 知识库问答 >
问题:

读取嵌套json pyspark时获得“模棱两可的引用”异常

沙富
2023-03-14

我有以下嵌套模式:

root
|-- fields: struct (nullable = true)
|    |-- configdata: struct (containsNull = true)
|    |    |-- field: string (nullable = true)
|    |    |-- type: string (nullable = true)
|    |    |-- value: string (nullable = true)
|    |-- configdata:struct (containsNull = true)
|    |    |-- field1: string (nullable = true)
|    |    |-- type1: string (nullable = true)
|    |    |-- value1: string (nullable = true)
|-- id: string (nullable = true)
|-- score: double (nullable = true)
|-- siteId: string (nullable = true)

我必须从这个json中读取configdata:property。但当我尝试这样做时:

newDf= dataframe.select(sf.array(sf.expr("configdata"))

它失败了,但有一个例外:

对字段的模糊引用结构字段(配置数据)

如您所见,configData是struct类型的,我必须从这个json中读取这两个配置数据。使用spark dataFrame API在Pyspark中开发的代码。有人能帮忙吗?

共有1个答案

万博涛
2023-03-14

有2个结构明显没有数组情况。这是模棱两可的,因为它们在同一级别。不可能。为第二个结构命名:“confidata1”,在源代码中。

 类似资料:
  • 谁能解释为什么我在代码后面得到“对'end'的引用是模棱两可的”?我明白这是因为与STD::END发生冲突。但是如果我把结束放在主函数中,它不会显示错误。在全局范围内定义与在主函数范围内定义有何不同?

  • 无法找出正确的方法来使用匹配器来识别我要处理的exchange方法的重载。我正在打的电话:

  • 我应该如何编写以下Mockito匹配器,以便调用不会有歧义? 我试图在代码中模拟的实际函数调用是:

  • 但是,当我尝试相同的示例时,通过将Integer更改为Object,代码编译得很好,输出为String 谁能帮助我理解为什么当输出来自其中有字符串的方法时,签名中有对象的方法是必需的。以及类型错误不明确的原因是什么。

  • 我有一节简单的课 这将输出为10,没有任何错误!!!我原以为这会给我一个ClassCastException,其中有些错误,比如Integer不能转换为HashMap。 出于好奇和愤怒,我尝试了返回值,如下所示

  • 问题内容: 如果在调用时没有设置信号挂起,则线程将被挂起,直到一个或多个挂起。set定义的信号在调用sigwait()时应已被阻止;否则,行为是不确定的。sigwait()对set中的信号的信号动作的影响未指定。 这真的很模棱两可,和这里有什么区别? 而其对如何进行选择的结论并不能完全清楚: 总之,当需要运行代码以响应异步信号来通知线程时,应使用sigwait()处理该信号。或者,如果实现提供信号