SparkSession与SparkContext SparkConf SQLContext HiveContext StreamingContext

澹台景山

2023-12-01

SparkSession与SparkContext SparkConf SQLContext HiveContext StreamingContext
参考blog：https://blog.csdn.net/dufufd/article/details/79088891

1.
SparkContext：
val sparkConf = new SparkConf().setAppName("SparkSessionZipsExample").setMaster("local")
val sc = new SparkContext(sparkConf).set("spark.some.config.option", "some-value")

SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中。
通过SparkSession来创建SparkContext。
JavaSparkContext sc = new JavaSparkContext(spark.sparkContext());

2.
SqlContext：
在2.0版本之前，使用Spark必须先创建SparkConf和SparkContext，代码如下：

val sparkConf = new SparkConf().setAppName("SparkSessionZipsExample").setMaster("local")
val sc = new SparkContext(sparkConf).set("spark.some.config.option", "some-value")
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)

不过在Spark2.0中只要创建一个SparkSession就够了，SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中。
下面的代码创建了一个SparkSession对象并设置了一些参数。这里使用了生成器模式，只有此“spark”对象不存在时才会创建一个新对象。
SparkSession统一了sqlcontext和hivecontext。

val warehouseLocation = "file:${system:user.dir}/spark-warehouse"
val spark = SparkSession
.builder()
.appName("SparkSessionZipsExample")
.config("spark.sql.warehouse.dir", warehouseLocation)
.enableHiveSupport()
.getOrCreate()

spark.conf.set("spark.sql.shuffle.partitions", 6)

3.
StreamingContext：
有两种创建StreamingContext的方式：
val conf = new SparkConf().setAppName(appName).setMaster(master);
val ssc = new StreamingContext(conf, Seconds(1));

StreamingContext，还可以使用已有的SparkContext来创建
val sc = new SparkContext(conf)
val ssc = new StreamingContext(sc, Seconds(1));

sparksession创建StreamingContext，把sc换成spark.sparkContext()即可。

SparkSession与SparkContext SparkConf SQLContext HiveContext StreamingContext

相关阅读

相关文章

相关问答

相关文档