当前位置: 首页 > 知识库问答 >
问题:

SparkStreaming示例中的ClassNotFoundException

皇甫乐
2023-03-14

我刚开始使用Spark streaming并尝试运行本教程中的一个示例,我正在跟踪制作并运行我们自己的NetworkWordCount。我已经完成了第8步,并从SBT制作了一个罐子。

现在我正在尝试使用第9步中的命令运行deploy my jar,如下所示:

bin/spark-submit --class "NetworkWordCount" --master spark://abc:7077 target/scala-2.11/networkcount_2.11-1.0.jar localhost 9999

我创建的jar包含“NetworkWordCount”类,该类具有来自spark示例的以下代码

package src.main.scala

import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.{Seconds, StreamingContext}

object NetworkWordCount {
  def main(args: Array[String]) {
    if (args.length < 2) {
      System.err.println("Usage: NetworkWordCount <hostname> <port>")
      System.exit(1)
    }

    //StreamingExamples.setStreamingLogLevels()

    // Create the context with a 1 second batch size
    val sparkConf = new SparkConf().setAppName("MyNetworkWordCount")
    val ssc = new StreamingContext(sparkConf, Seconds(1))

    val lines = ssc.socketTextStream(args(0), args(1).toInt, StorageLevel.MEMORY_AND_DISK_SER)
    val words = lines.flatMap(_.split(" "))
    val wordCounts = words.map(x => (x, 1)).reduceByKey(_ + _)
    wordCounts.print()
    ssc.start()
    ssc.awaitTermination()
  }
}

我无法确定我做错了什么。

共有1个答案

鄢开诚
2023-03-14

spark-submit参数--class采用完全限定的类名。对于上面的代码,它应该是src.main.scala.networkcount

bin/spark-submit --class src.main.scala.NetworkCount --master spark://abc:7077 target/scala-2.11/networkcount_2.11-1.0.jar localhost 9999

注意:使用的包名称看起来像IDE安装问题。src/main/scalascala代码库的典型根,而不是包名。

 类似资料:
  • :) 我已经在一个(奇怪的)情况中结束了自己,简单地说,我不想使用来自Kafka的任何新记录,因此暂停主题中所有分区的sparkStreaming消费(InputStream[ConsumerRecord]),执行一些操作,最后,恢复消费记录。 首先这可能吗? 我一直在尝试这样的事情: 但是我得到了这个: 任何帮助我理解我遗漏了什么,以及为什么当消费者明确分配了分区时我会得到空结果的帮助都将受到欢

  • 但是Flink医生说: 在启用Flink检查点的情况下,Flink Kafka使用者将使用来自主题的记录,并以一致的方式定期检查其所有的Kafka偏移量以及其他操作的状态。在作业失败的情况下,Flink会将流程序恢复到最新检查点的状态,并从检查点中存储的偏移量开始重新使用来自Kafka的记录。 阅读其他来源,我猜Flink检查点将保存程序的状态以及消耗的偏移量,但Spark检查点只是保存消耗的偏移

  • 由于Codename One支持基本Java对象功能的子集,所以在将数据添加到DefaultListModel之前,我不能使用vector.sort()对其进行排序。因此,在Codename One中寻找其他排序选项时,我找到了FilterProxyListModel。 我找不到如何正确初始化FilterProxyListModel的示例,因为它使用了一个有趣但棘手的“代理”设计模式,我对此并不熟

  • 本文向大家介绍HTML5中的MathML示例,包括了HTML5中的MathML示例的使用技巧和注意事项,需要的朋友参考一下 HTML5的HTML语法允许使用<math> ... </ math>标记在文档内部使用forMathML元素。 大多数网络浏览器都可以显示MathML标签。如果您的浏览器不支持MathML,则建议您使用最新版本的Firefox。 让我们来看一个例子:

  • 问题内容: Java API中Singleton设计模式的最佳示例是什么?是类单身? 问题答案: 我想到的只有两个例子: 另请参阅 : Java API中GoF设计模式的真实示例 更新 :要回答PeterMmm(当前已删除?)的注释(问我如何知道它是一个单例),请检查javadoc和源代码: 它每次都返回相同的实例,并且具有构造函数。

  • 本文向大家介绍C ++中的多态示例,包括了C ++中的多态示例的使用技巧和注意事项,需要的朋友参考一下 多态是面向对象编程的关键特征,即具有多种形式。在C ++中,这分为编译时多态和运行时多态。 编译时多态的一个示例是函数重载或运算符重载。函数覆盖是运行时多态性的一个示例。 C ++中使用函数重载的多态示例如下。 示例 输出结果 上面程序的输出如下。 现在,让我们了解以上程序。 类Example中