当前位置：首页 > 专题 >

《scala》专题

目录中的Spark Scala列表文件夹
我想使用Scala/Spark列出hdfs目录中的所有文件夹。在Hadoop中，我可以使用命令:来完成此操作我用： PS：我也检查了Thread：Spark iterate HDFS目录，但它对我来说不起作用，因为它似乎不在HDFS目录上搜索，而是只在模式为file//的本地文件系统上搜索。
Spark 2.0 Scala-读取带有转义分隔符的csv文件
无法将broker list参数从Scala传递到Kafka：属性Bootstrap.Servers无效
null 这意味着我应该将代理列表（端口)从Scala传递到远程Kafka，因为否则它将尝试使用默认端口。问题是，根据日志，远程计算机无法识别参数。我还尝试将此参数重命名为、和，但日志中始终出现相同的错误，然后默认使用端口（显然不使用消息）。在POM文件中，我对Kafka和Spark使用了以下依赖关系：这是我的Scala代码（如果我使用自己安装在Amazon Cloud中的Kafka，在那里
在Scala/Spark中有条件地映射CSV文件中的行，以生成另一个CSV文件
null 因此，我希望有条件地映射CSV文件的所有行，并将结果导出到另一个CSV文件中，每行的条件如下： > 如果第4列的值不为null，那么该行第4、5、6和7列的值应存储为名为LastValueSof4to7的数组。（在数据集中，如果第4列中的元素不为null，则第1、2和3列为null，可以忽略）如果第3列的值不为null，那么第1、2和3列的值以及上述lastValuesOf4to7数组
从scala/spark-shell向hive表提供多个变量
我在scala/Spark-Shell中有4个变量。我需要把这个喂到蜂巢桌子上，就像这样：因子系数我肯定我错过了如何做到这一点的整个想法。任何帮助都是真诚的感谢。
为什么spark scala JDBC将oracle中的NUMBER(1)转换为spark dataframe中的boolean
下面是我使用spark scala JDBC代码连接到oracle的程序：火花输出：
在Spark 2.2.0和Scala中求和数据帧的列
我得到以下错误：org.apache.spark.sql.analysisException：不允许在另一个聚合函数的参数中使用聚合函数。请在子查询中使用内部聚合函数。；；我尝试了多种解决方案来解决这个问题，但似乎没有任何效果。所有的想法都得到了赞赏。谢了！
Spark--在Scala中从两个数组的笛卡尔乘积创建一个数据frame
我有两个数组：我可以在一个数组中创建这两个数组的笛卡尔积，如下所示：输出将是：
Spark/Scala打开压缩CSV文件
我对Spark和Scala是新手。我们将广告事件日志文件格式化为CSV，然后使用PKZIP进行压缩。我已经看到了许多关于如何使用Java解压缩压缩文件的示例，但是如何使用Scala for Spark来实现这一点呢？我们最终希望从每个传入文件中获取、提取并加载数据到Hbase目标表中。也许这可以用HadooprDD来完成吗？在这之后，我们将引入Spark streaming来监视这些文件。
解压缩多个*.gz文件，并在spark scala中生成一个csv文件
将文件从Hdfs复制到Hdfs scala
是否有一种已知的方法使用Hadoop api/spark scala在Hdfs上将文件从一个目录复制到另一个目录？我尝试使用copyFromLocalFile，但没有帮助
在Scala/Spark中在HDFS上将文件从一个文件夹移动到另一个文件夹
我得到以下错误：线程“main”java.lang.IllegalArgumentException：错误的fs：hdfs：/user/o/datasets/data.txt，应为：file：/// 也是如此，因为它们用于在文件系统之间传输文件，而不是在文件系统内传输文件。我还尝试了，但根本没有任何作用（没有错误或任何东西）。
如何使用scala将不同的文件名传递给spark
我在集群中有以下代码： csv_file=“/usr/usr1/test.csv” 但是程序不是在挑FI。有人能帮忙吗？
使用Spark Scala以filename作为参数读取Excel文件时出错
有人能帮我用Spark Scala读API读excel文件吗？我尝试安装（从Maven）与Databricks Runtime 6.5和6.6（Apache Spark 2.4.5,Scala 2.11）集群，但只有在硬编码文件路径的情况下才能工作。
scala-泛型中的任何vs下划线
Scala中的以下泛型定义有什么不同：和我的直觉告诉我它们大致相同，但后者更明确。我发现了一些情况，前者编译了，而后者没有，但我无法确定确切的差别。谢谢编辑：我能再加入一个吗？

首页

43

44

45

46

47

48

49

50

51

尾页

最新发布

💼｜腾讯产品运营实习｜详细面经🔍高德地图产品经理(社招)哈啰产品经理实习面经 python-数据分析岗位-22届考研-华OD面经安克数开

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

javascript - 为什么相同的代码无法正确排列数据？求java/php大佬帮帮忙？epub - 有没有类似语雀这样的笔记管理软件最后可以导出为EPUB格式的？前端 - 如何在抖音H5页面中让安卓手机拉起自带应用商店下载APP？人工智能 - 要运行本地Midjourney只自己用（只自己使用，不给别人服务使用）1张显卡就足够了吗？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

liblogger MLF git-repo-watcher prefuse DuinoPack Grid studio mail_osc-WriteCode carloop-library

文档资料

xdebug 中文文档 DC.js 入门教程 GitHub 漫游指南 Caffe2 中文教程 nw.js 中文文档