问题：

SparkR，将嵌套JSON字符串的一列拆分为列

曹渝

2023-03-14

我来自R，刚接触过SparkR，并试图将JSON字符串的SparkDataFrame列拆分为各自的列。Spark DataFrame中的列是具有如下模式的数组：

> printSchema(tst)
root
 |-- FromStation: array (nullable = true)
 |    |-- element: string (containsNull = true)
 |-- ToStation: array (nullable = true)
 |    |-- element: string (containsNull = true)

list("{\"Code\":\"ABCDE\",\"Name\":\"StationA\"}", "{\"Code\":\"WXYZP\",\"Name\":\"StationB\"}", "{...

非常感谢，内特

共有1个答案

朱兴安

2023-03-14

我想你需要把tst转换成普通的R对象

df = collect(tst)

然后使用df操作，就像使用任何其他R data.frame一样

类似资料：

将没有分隔符的字符串拆分为列

问题内容：我需要在SQL Server 2012中将一列中的字符串拆分为一个字符，并将每个字符串拆分成它自己的列。例如：如果我有一个栏，我需要把它拆分成，，，，，与每个这些转化为自己列。要拆分的列的长度可能会有所不同，因此我需要使其尽可能地动态。问题答案：您可以这样做：输出：这是动态版本：
将Spark Dataframe字符串列拆分为多列

理想情况下，我希望这些新列也被命名。
如何将dataframe字符串列拆分为两列？

我不知道如何使用来实现拆分行单元格的目标。我可以使用添加一个新列，并用填充它。有什么想法吗？
将嵌套json解析为原始字符串

我正在编写一个接收SQS队列对象的Lambda函数。SQS将json对象作为字符串值发送给SQS。当我在Lambda中接收到请求时，AWS已经将其包装成一个新的JSON，由于JSON是一个字符串值，因此它将成为无效的JSON。现在body.message不是有效的JSON。我尝试将它解析为一个原始值，比如如何使用Jackson在对象中包含原始JSON？但它总是抱怨，它在期待逗号分隔对象的地方找
Python-如何将字符串拆分为列表？

问题内容：我希望我的Python函数拆分一个句子（输入）并将每个单词存储在列表中。我当前的代码拆分了句子，但没有将单词存储为列表。我怎么做？问题答案：这应该足以将每个单词存储在列表中。 words已经是句子中单词的列表，因此不需要循环。其次，这可能是拼写错误，但是你的循环有些混乱。如果你确实确实想使用附加，它将是：不
将具有重复字符的字符串拆分为列表

问题内容：我对Regex的经验不足，但是我已经阅读了很多。假设有一个字符串，我想要一个列表，该列表的字符串分为两个部分。我的方法是让一个小组检查是否是数字，然后检查该小组是否重复。像这样我认为基本上可以检查“ digit”或“ digit +”是否相同。我认为这可以满足我的要求。问题答案：用途：

SparkR，将嵌套JSON字符串的一列拆分为列

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档