有人能给我解释一下spark之间的区别吗。createDataFrame()和sqlContext。createDataFrame()?我见过这两种用法,但不了解确切的区别或何时使用。
我假设您使用的是版本超过2的Spark,因为在第一种方法中,您似乎指的是仅在版本2之后可用的Spark会话
>
<代码>火花。createDataFrame(…) 是在spark 2中创建df的首选方法。请参阅链接文档以查看可能的用法,因为它是一个重载方法。
sqlContext.createDataFrame(...)
(火花版本-1.6)是在火花1. x中创建df的常用方法。正如您可以在链接的留档中阅读的那样,它在火花2. x中被弃用,并且仅为向后兼容而保留
Spark 1中使用结构化数据(行和列)的入口点。十、
从Spark 2.0开始,这将被SparkSession取代。然而,为了向后兼容,我们将类保留在这里。
因此,为了回答您的问题,您可以在Spark 2. x中同时使用两种方式(尽管第二种方式已被弃用,因此强烈建议使用第一种方式),并且您只能使用第二种方式,前提是您被Spark 1. x卡住了
编辑:SparkSession
实现(即源代码)和SQLContext
实现
下面是Gradle Build的stacktrace: Build.Gradle看起来是这样的: 编辑1:从META-INF目录中的httpmime库的本地副本中删除我有问题的文件,成功解决了此问题
cp(copy),可以复制指定的文件与目录。 cp 要复制的源 复制到的目标 练习:复制文件 复制一份 ninghao-project 下面的 README.md ,放到 ninghao-project/app 这个目录的下面。 cp ninghao-project/README.md ninghao-project/app/ 练习:复制目录 要复制一个目录连同它里面包含的所有文件与子目录,需
说明 调用方法: $.f2e.util.clip(text,message) 插件说明: 复制文字,现只支持IE 参数说明: 参数名 类型 说明 备注 text string 复制的文本内容 无 message string 复制成功后的提示文案 可不传 默认文案 复制成功 类绑定 <html> //复制 <a class="f2e-util-clip" data-text="
NowCoder 题目描述 输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针指向任意一个节点),返回结果为复制后复杂链表的 head。 // java public class RandomListNode { int label; RandomListNode next = null; RandomListNode random =
我有一个这样的数据帧。 现在,我想将第1列中的dict扩展到如下所示的各个列。 有没有捷径可以实现这一点?
我想在POI中使用OPCPackage和XSSFWorkbook打开一个excel文件。由于这个文件将在不同的线程中使用,我想避免重新打开该文件以节省时间(POI在打开一个xlsx文件时速度较慢)。所以我所做的是将工作簿保存在一个全局变量中,然后线程将访问这个全局变量并重用对象。 我遇到的问题是当我尝试重用对象时,它影响/修改了excel文件的原始数据。