当前位置: 首页 > 知识库问答 >
问题:

从Pandas DataFrame创建Spark DataFrame

廉高邈
2023-03-14

我试图从一个简单的熊猫数据流创建一个火花数据流。这是我遵循的步骤。

import pandas as pd
pandas_df = pd.DataFrame({"Letters":["X", "Y", "Z"]})
spark_df = sqlContext.createDataFrame(pandas_df)
spark_df.printSchema()

在这之前一切都好。输出为:

spark_df.show()

Spark UI

版本:V2.4.0

主人:本地[*]

共有1个答案

章盛
2023-03-14

导入并初始化findspark,创建spark会话,然后使用该对象将pandas数据帧转换为spark数据帧。然后将新的spark数据帧添加到目录中。在Jupiter 5.7.2和Spyder 3.3.2以及python 3.6.6中测试并运行。

import findspark
findspark.init()

import pyspark
from pyspark.sql import SparkSession
import pandas as pd

# Create a spark session
spark = SparkSession.builder.getOrCreate()

# Create pandas data frame and convert it to a spark data frame 
pandas_df = pd.DataFrame({"Letters":["X", "Y", "Z"]})
spark_df = spark.createDataFrame(pandas_df)

# Add the spark data frame to the catalog
spark_df.createOrReplaceTempView('spark_df')

spark_df.show()
+-------+
|Letters|
+-------+
|      X|
|      Y|
|      Z|
+-------+

spark.catalog.listTables()
Out[18]: [Table(name='spark_df', database=None, description=None, tableType='TEMPORARY', isTemporary=True)]
 类似资料:
  • 问题内容: 我创建了一个简单的POJO: 经过一番搜索,我发现了这一点: 但是有了这个我得到了错误: 我找到了另一个解决方案: 但是这种方法不存在。 那么如何将POJO转换为JSON? 问题答案: 只需使用java Gson API : 然后您可以从json 创建一个,如下所示: 看看 GSON用户指南 ,这 SIMPLE GSON实例 的详细信息。

  • 我正在尝试通过LambdaMetafactory动态创建BiConsumer类型的方法引用。我试图应用 https://www.cuba-platform.com/blog/think-twice-before-using-reflection/ 上的两种方法 - createVoidHandlerLambda和这里的Create BiConsumer作为字段设置器,而不反映Holger的答案。

  • 大家好 错误:org.json.jsonException:不是原始数组:类org.json.jsonArray 我不明白为什么这是一个问题。我想从对象中获得JSONArray。

  • 我是一个xml和XSL的新手,使用遗留平台... 我正在寻找一个从XPath创建xml的解决方案。碰巧看到这篇文章如何从一组XPath表达式生成XML文件?帮了我大忙。 与“comments”一节中讨论的请求类似,我试图将整个XSLT作为字符串传递,并使用Saxon作为sting back接收结果。接收结果为字符串,没有问题。但是当将XSL作为字符串传递时,它会抱怨“document()”,它是

  • 问题内容: 我们正在从Oracle JDK / JRE切换到OpenJDK。现在,我只找到了JDK,但我也想从OpenJDK获得JRE。这是为了在客户端上安装我们的应用程序而无需完整的JDK。 有没有一种方法可以从适用于Windows X64的OpenJDK创建JRE包? 问题答案: 受到文章使用jlink为非模块化应用程序构建Java运行时的启发,我使用了以下命令: 获取所有可用的openjdk

  • 问题内容: 我正在尝试使用jQuery UI创建动态菜单。 我将从JSON文件中获取条目并创建菜单项。在大规模尝试之前,我决定做一个小演示。这是我的小提琴,它按照我想要的方式工作。现在,我无法将其与JSON文件一起使用。 工作场所 这是JSON 我如何使用JSON中的值设计我的整个菜单,其中Li类似于以下内容。 编辑: 这个问题听起来好像我还没有尝试过,但是我已经尝试过。它只是我无法理解的JSON

  • 问题内容: 我有一个我想在SQL企业管理器中创建表的视图,但是运行此查询时总是会出现错误: 到目前为止,错误是:“’as’处的语法错误” 视图太大。是否可以使用前10名? 问题答案: 不支持。 用这个: 或者

  • 对于演示节目,我被要求提供一个powerpoint文件。然而,我更喜欢LaTeX和Beamer来创建我的幻灯片。所以我有了创建一个自动脚本的想法,从我的PDF文件中提取图像并创建一个PPT文件。 我是Automator新手,但通过谷歌搜索,我很容易就找到了: 询问查找器项目。 将 PDF 页面呈现为图像。( 分辨率 : 300) 创建PPT图片幻灯片 不幸的是,有一个问题 :图片不能完全填满幻灯片