当前位置：首页 > 工具软件 > spark-on-k8s-operator > 使用案例 >

hadoop组件---spark实战----spark on k8s模式k8s原生方式安装spark2.4.4 client mode提交python程序在spark中访问s3

锺离慈

2023-12-01

我们在上篇文章中已经成功运行使用spark-submit提交了python程序运行spark。

hadoop组件—spark实战----spark on k8s模式k8s原生方式安装spark2.4.4 client mode提交python程序和运行pyspark

本篇文章记录在client pod中使用spark-submit提交python程序在spark on k8s中访问s3。

进入client的pod

关于pod的创建和yaml请参考上一篇文章。

使用命令进入pod中

kubectl exec -ti spark-client-test  -- bash

进入安装目录

cd spark-2.4.4-bin-hadoop2.7/

创建spark访问s3的py文件

使用命令

vi spark-s3.py

输入代码如下:

from __future__ import print_function

import sys
from random import random
from operator import add

from pyspark.sql import SparkSession


if __name__ == "__main__":

    spark = SparkSession\
        .builder\

类似资料：

hadoop组件---spark实战----spark on k8s模式k8s原生方式安装spark2.4.4 client mode提交python程序在spark中访问s3

进入client的pod

创建spark访问s3的py文件

相关阅读

相关文章

相关问答

相关文档