当前位置：首页 > 工具软件 > Scalding > 使用案例 >

Scalding初探之三：Hadoop实战

公羊兴文

2023-12-01

Java版本

如果在Scala工程中混入Java类导致java版本不match，可能会抛错

java.lang.UnsupportedClassVersionError: XXX Unsupported major.minor version 51.0

在build.sbt中加入

javacOptions ++= Seq("-source", "1.6", "-target", "1.6")

轻松搞定

特别的技巧

读一读官网的Frequently asked questions，会获得一些特别的技巧哦

Pass the option --tool.partialok to your job

2 Read a single reduced value from a pipe

Job.next & Source.toIterator

3 Cases classes

Define it outside of your Job

4 Hadoop jobConf

pass parameters to my hadoop job

hadoop jar myjar \ 
com.twitter.scalding.Tool \ 
-D mapred.output.compress=false \ 
-D mapred.child.java.opts=-Xmx2048m \ 
-D mapred.reduce.tasks=20 \ 
com.class.myclass \ 
--hdfs \ 
--input $input \ 
--output $output

append parameters to jobConf

class WordCountJob(args : Args) extends Job(args) {
// Prior to 0.9.0 we need the mode, after 0.9.0 mode is a def on Job.
override def config(implicit m: Mode): Map[AnyRef,AnyRef] = {
   super.config ++ Map ("my.job.name" -> "my new job name")
  }

转载于:https://www.cnblogs.com/wei-li/p/ScaldingFirstSight3.html

类似资料：

相关阅读

Ruby基础语法初探 JavaScript设计模式初探详解Tomcat7中WebSocket初探 Hadoop 1和Hadoop 2之间的区别 Postgresql查询效率计算初探

相关文章

探探一面 hadoop与第三方（CDH等）的比较 JUC之ConcurrentSkipListMap (三)四战腾讯实习之腾讯视频三面 JavaScript算法-三数之和

相关问答

MySQL-三个实体之间的多对多关系 Spring Cloud 侦探仪器不断打印 TODO 之前/之后 removeServiceName=无法实例化Hadoop hdfs DistributedFileSystem 设计三个实体之间的多对多关系哈希实现中的线性探测

相关文档

初识 PhalApi：探索接口服务开发的技艺 Hadoop 中文文档 hadoop 基础教程 Hadoop 数据库教程 Node Debug 三法三例