问题：

当代码在Spark shell中工作时，Submit不能引用“--jars”指定的jar？

仲霍英

2023-03-14

我使用IntelliJ创建了一个sbt项目。我在项目的lib文件夹中复制了所需的jdbc jarsqljdbc42.jar。SBT包已成功完成。我在Windows上通过spark-shell--driver-class-path C:\sqljdbc_6.0\enu\jre8\sqljdbc42.jar启动了spark。

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
import java.sql._

object ConnTest extends App {
  val conf = new SparkConf()
  val sc = new SparkContext(conf.setAppName("Test").setMaster("local[*]"))

  // The following four statements work if running interactively in the Spark shell
  val sqlContext = new org.apache.spark.sql.SQLContext(sc)
  val jdbcSqlConn = "jdbc:sqlserver://...;databaseName=...;user=...;password=...;"
  val jdbcDf = sqlContext.read.format("jdbc").options(Map(
        "url" -> jdbcSqlConn,
        "dbtable" -> "testTable"
      )).load()
  jdbcDf.show(10)

  sc.stop()
}

但是，下面的spark-submit命令得到了错误。

spark-submit.cmd --class ConnTest --master local[4] .\target\scala-2.11\test_2.11-1.0.jar
spark-submit.cmd --class ConnTest --master local[4] .\target\scala-2.11\test_2.11-1.0.jar --jars \sqljdbc_6.0\enu\jre8\sqljdbc42.jar

Exception in thread "main" java.sql.SQLException: No suitable driver
        at java.sql.DriverManager.getDriver(Unknown Source)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions$$anonfun$7.apply(JDBCOptions.scala:84)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions$$anonfun$7.apply(JDBCOptions.scala:84)
        at scala.Option.getOrElse(Option.scala:121)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:83)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:34)
        at org.apache.spark.sql.execution.datasources.jdbc.JdbcRelationProvider.createRelation(JdbcRelationProvider.scala:32)
        at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:330)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:152)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:125)
        at ConnTest$.delayedEndpoint$ConnTest$1(main.scala:14)
        at ConnTest$delayedInit$body.apply(main.scala:6)
        at scala.Function0$class.apply$mcV$sp(Function0.scala:34)
        at scala.runtime.AbstractFunction0.apply$mcV$sp(AbstractFunction0.scala:12)
        at scala.App$$anonfun$main$1.apply(App.scala:76)
        at scala.App$$anonfun$main$1.apply(App.scala:76)
        at scala.collection.immutable.List.foreach(List.scala:381)
        at scala.collection.generic.TraversableForwarder$class.foreach(TraversableForwarder.scala:35)
        at scala.App$class.main(App.scala:76)
        at ConnTest$.main(main.scala:6)
        at ConnTest.main(main.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
        at java.lang.reflect.Method.invoke(Unknown Source)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:743)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:187)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:212)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:126)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

更新：spark代码可以工作，如果我直接在spark shell中运行语句，我可以看到表内容。

更新2：运行spark-submit时确实显示了以下消息

17/05/15 16:12:30 INFO SparkContext：添加了JAR文件：/c:/sqljdbc_6.0/enu/jre8/sqljdbc42.JAR（在spark:/10.8.159.130:7587/jars/sqljdbc42.JAR，时间戳为1494879150052

共有1个答案

张啸

2023-03-14

设置另一个选项解决了这个问题。

"driver" -> "com.microsoft.sqlserver.jdbc.SQLServerDriver",

类似资料：

当代码在Spark shell中工作时，spark-submit不能引用“--jars”指定的jar？

我使用IntelliJ创建了一个sbt项目。我将所需的jdbc jar复制到项目的文件夹中。成功完成。在Windows上，我通过启动了spark。但是，以下命令得到了错误。
spark-submit: - jars不工作

我正在为Spark Streaming作业构建指标系统，在系统中，指标收集在每个执行程序中，因此需要在每个执行程序中初始化指标源（用于收集指标的类）。度量源被打包在一个jar中，当提交作业时，jar使用参数'--jars'从本地发送到每个执行器，但是，执行器在jar到达之前开始初始化度量源类，因此，它会抛出类未找到异常。似乎如果执行者可以等到所有资源都准备好，问题就会得到解决，但我真的不知道该
Spark-submit在hdfs中应用程序jar时不工作

我正在尝试使用bin/spark-submit运行一个spark应用程序。当我引用本地文件系统中的应用程序jar时，它会正常工作。但是，当我将我的应用程序jar复制到hdfs中的一个目录时，我得到了以下异常：我使用的是hadoop版本2.6.0和spark版本1.2.1
为什么Sikulix代码不能在JMeter中工作

我有以下Sikuli代码在JMeter这是不工作。我尝试了Beanshell采样器和JSR223采样器，但在这两种情况下都不起作用。这是我得到的错误。 JSR223采样器响应消息：javax。剧本脚本异常：javax。剧本ScriptException:FindFailed:C:\scripts\patterns\vnc\vncviewer。png：（32x31）在R[0,0 1920x108
“代码。”OSX/Mac上的Visual Studio代码不能在命令行中工作

命令“code”。在这本手册里不起作用？之前的所有其他步骤都奏效了。如何调用OSX终端中的Visual Studio代码？
代码不能在IE 11中运行，在Chrome中工作正常

我将元素的ID存储在变量中。问题是什么？

当代码在Spark shell中工作时，Submit不能引用“--jars”指定的jar？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档