在Spark中,count函数返回数据集中存在的元素数。
count
在此示例中,计算数据集中存在的元素数量。使用并行化集合创建RDD。
scala> val data = sc.parallelize(List(1,2,3,4,5))
现在,可以使用以下命令读取生成的结果。
scala> data.collect
应用count()函数来计算元素数。
count()
scala> val countfunc = data.count()