当前位置：首页 > 软件库 > 服务器软件 > 分布式应用/网格 >

Spark Kernel

提供程序使用 Apache Spark 的基础

授权协议 Apache 2.0

开发语言 Scala

所属分类服务器软件、分布式应用/网格

软件类型开源软件

地区不详

投递者龚盛

操作系统跨平台

开源组织 IBM

适用人群未知

软件概览

Spark Kernel 的最主要目标：提供基础给交互应用程序联系和使用 Apache Spark。

几个主要特性：

定义和运行 Spark 任务
- 以类似 Scala REPL 和 Spark Shell 的方式，动态地执行 Scala 代码
收集数据存储的结果
- 通过 Spark Kernel，将执行结果和数据流返回到你的应用程序。
- 使用 Comm API —— 一个 IPython 协议的抽象 —— 在你的应用程序和 Spark Kernel 之间进行更详细的数据通信和同步。
脱离 Apache Spark 来主持（Host）和管理你的应用。
- Spark Kernel 作为向 Apache Spark 集群发出的请求的一个代理。

使用案例

Spark（二）编译Spark

编译Spark方式： Spark官网提供了多种利用Maven编译Spark源码的方式，编译之前需要配置所需环境，Maven版本必须是3.3.9或者更高，JDK必须是1.8或者更高。利用本地Maven编译：需要配置内存区的大小，配置如下：export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m" 利用Spark自带的Maven编译：在解压后的
spark-Tuning spark

原文：Tuning Spark Tuning Spark Data Serialization 序列化在分布式应用的性能中扮演重要角色，提供两种序列化: Java serialization: By default, Spark serializes objects using Java’s ObjectOutputStream framework, and can work with any c
【spark】spark+kafka

:启动kafka MobaXterm_Personal_8.5.exe D:/Develop/kafka_2.10-0.8.2.1/bin/windows/zookeeper-server-start.bat D:/Develop/kafka_2.10-0.8.2.1/config/zookeeper.properties D:/Develop/kafka_2.10-0.8.2.1/bin/w
Spark-spark streaming

概念关联初始化streamingcontext 离散流输入dstream dstream的转化 dstream的输出操作缓存或者持久化 checkpointing 部署应用程序监控应用程序性能调优减少批数据的执行事件设置正确的批容量内存调优容错语义
spark-Spark Configuration

原文：spark configuration Spark Properties 设置参数的3中具体方式 sparkconf bin/spark-submit conf/spark-defaults.conf文件优先级:SparkConf>spark-submit or spark-shell>spark-defaults.conf file.最终的参数为3者的merge Spark prope
Spark之Spark-Sql

Spark Sql简介 Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。我们已经学习了Hive，它是将Hive SQL转换成MapReduce然后提交到集群上执行，大大简化了编写MapReduce的程序的复杂性，由于MapReduce这种计算模型执行效率比较慢。所有Spark
Spark_Spark Spark优化 - RDD暂存

编写一个Spark 作业较为容易，但是编写一个高效的 spark 并不是一个容易的事。本篇主要从暂存的角度讲解下，如何去优化 Spark Job. 参考文章：【转】Spark性能优化指南——基础篇 https://www.cnblogs.com/hark0623/p/5533803.html spark Streaming 存储级别定义StorageLevel ht
[Spark][spark_core]#1_spark入门

[root@node00 sbin]# spark-shell --master local[2] val file = spark.sparkContext.textFile("file:///usr/local/wc.txt") val wordCounts = file.flatMap(line => line.split(",")).map((word => (word,1))).redu
CC00081.spark——|Hadoop&Spark.V07|——|Spark.v07|Spark 原理源码|Spark Context|

一、Spark Env内部组件 ### --- SparkEnv内部组件 ~~~ SparkEnv是spark计算层的基石，不管是 Driver 还是 Executor， ~~~ 都需要依赖SparkEnv来进行计算，它是Spark的执行环境对象， ~~~ 其中包括与众多Executor执行相关的对象。 ~~~ Spark 对任务的计算都依托于 Executor
[Spark][spark_core]#0_spark安装

编译安装 Local模式 [root@node00 java]# spark-shell --master local[2] http://192.168.106.100:4040/jobs/ Standalone模式 cp conf/spark-env.sh.template spark-env.sh vi spark-env.sh SPARK_MASTER_HOST=localhost SPA
Spark之spark shell

前言：要学习spark程序开发，建议先学习spark-shell交互式学习，加深对spark程序开发的理解。spark-shell提供了一种学习API的简单方式，以及一个能够进行交互式分析数据的强大工具，可以使用scala编写（scala运行与Java虚拟机可以使用现有的Java库）或使用Python编写。 1.启动spark-shell spark-shell的本质是在后台调用了spar
Spark 之 spark submit

转自：https://my.oschina.net/cjun/blog/509247 一、命令注意./BnmsKpiCal-0.0.1.jar包一定要放在最后面，要不然jar包后面的参数不会生效 1.向spark standalone以client方式提交job。 ./spark-submit --master spark://hadoop3:7077 --deploy-mode client

Spark Kernel

同类工具

相关阅读

相关文章

相关问答

相关文档