当前位置：首页 > 专题 >

《同花顺校招》专题

Spark：groupBy花了很多时间
在此RDD上应用筛选器，并将相关行的范围移出:filter 在此RDD上应用筛选器，并将相关行的范围移出:filter 加入RDD:join 应用map阶段计算投资:map 应用GroupBy阶段根据所需视图对数据进行分组:GroupBy 应用map阶段来按照上述步骤中实现的分组聚合数据（例如跨时间段查看数据），并根据需要收集的resultset创建新对象:map 收集结果：收集因此，如果用户想
火花流口水-性能
我在Scala/Spark中有一个批处理作业，它根据一些输入动态创建Drools规则，然后评估规则。我还有一个与要插入到规则引擎的事实相对应的输入。到目前为止，我正在一个接一个地插入事实，然后触发关于这个事实的所有规则。我正在使用执行此操作。 seqOp运算符的定义如下：以下是生成的规则的示例：对于同一RDD，该批次花了20分钟来评估3K规则，但花了10小时来评估10K规则！我想知道根据事
音频短裤到花车
利用JDK~6实现了一种阴基音检测算法我想在没有javax的Android API 10上实现基音检测。声音YIN使用的样本包。API 10确实有RecordAudio，它可以通过读取（字节/短[]int pos，int size）传递字节或短字符。什么可以优化性能？A）将Android 1.5的RecordAudio扩展为A floats to YIN（我的首选方法），或B）从Record
`火花。调试。MaxToString字段`
Spark v2.4 <代码>火花。sql。调试。此处定义了MaxToString字段https://github.com/apache/spark/blob/master/sql/catalyst/src/main/scala/org/apache/spark/sql/internal/SQLConf.scala 不知何故，它变成了在https://github.com/apache/spark
持续火花流输出
我正在从一个消息应用程序收集数据，我目前正在使用Flume，它每天发送大约5000万条记录我希望使用Kafka，使用Spark Streaming从Kafka消费并将其持久化到hadoop并使用impala进行查询我尝试的每种方法都有问题。。方法1-将RDD另存为parquet，将外部配置单元parquet表指向parquet目录问题是finalParquet.saveAsParquetF
火花作业cassandra错误
每次使用cassandra connector在spark中运行scala程序时都会出现此错误这是我的程序
火花读取空目录
试图读取一个空的镶木地板目录，得到这个错误无法指定拼花地板的架构。必须手动指定我的代码尝试处理scala尝试和定期检查空目录任何想法
茉莉花2.0完成后
我正在使用jasmine 2.0。我试图理解函数。使用以下基本茉莉花代码：我认为我看到的发生：运行，安装时钟，记录安装测试运行时，setTimeout不执行任何操作测试等待5秒（Jasmine失败前的默认超时）测试失败，因为从未调用。我知道这一点，因为我得到了错误：超时-异步回调没有在jasmine指定的超时内调用。DEFAULT_TIMEOUT_INTERVAL。然后运行，卸载
鱼眼畸变与码花
我已经成功地为一个示例数据集实现了codeflower视图。用于实现这一目标的代码是：我现在希望添加鱼眼扭曲到这个可视化，不知道如何去做。我已经研究了鱼眼的留档，但当我使用codeflower.js我不确定如何访问svg元素了。任何帮助都很感激。谢谢你。
火花码给出错误
我在运行下面我写的SPARK代码时出错了。我试图根据键找到所有向量的总和。每个输入行以键（整数）开始，然后是127个浮点数，这是一个具有127个维度的单个向量，即每一行以键和向量开始。
火花流集成水槽
我遵循火花流水槽集成的指导。但我最终无法获得任何事件。（https://spark.apache.org/docs/latest/streaming-flume-integration.html）谁能帮我分析一下？在烟雾中，我创建了“avro_flume.conf”的文件，如下所示：在文件中，123.57.54.113是本地主机的ip。最后，根本没有任何事件。怎么了？谢谢！
使用Tweepy的火花流
我正在尝试使用python库Tweepy来传输twitter数据。我设置了工作环境，谷歌了一下这些东西，但是我不知道它们是如何工作的。我想在python (tweepy)中使用spark streaming(DStream-Batch processing)。我至少经历了以下环节: < li >如何获取tweepy中某个位置的特定标签的推文？ < Li > http://spark . Apach
火花教程的问题
我正在尝试 https://github.com/apache/spark/blob/v2.0.1/examples/src/main/scala/org/apache/spark/examples/sql/streaming/StructuredNetworkWordCountWindowed.scala 个例子。但是，指定端口号处的输入应该是什么？
森林火花斯卡拉
我尝试使用I forest https://github.com/titicaca/spark-iforest,的scala实现，但是当我构建时(就像README中报告的< code>mvn clean package)，它给我这些错误: 有人知道为什么吗？谢谢 scala版本2.11.12 火花版本2.4.0 maven版本3.5.2 我修改了pom.xml，调整了scala、spark和mav
番石榴/火花问题
我的 Spark 版本是 2.2.0，它在本地工作，但在具有相同版本的 EMR 上，它给出了以下异常。

首页

25

26

27

28

29

30

31

32

33

尾页

最新发布

百度数据开发实习面经雷克沙测开二面上海百考丝信息科技有限公司--java面经海致科技--java面经京东Java一二面面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 明明有这个文件为什么还报错？前端 - 使用 wxt 框架开发浏览器扩展遇到的问题?前端 - 你们用react-markdown做聊天的时候，内容是流不断返回的，如果有图片的话。会造成页面闪烁，因为contten不断变化，重新渲染了。怎么解决的？vue2 - vue虚拟滚动列表vue-virtual-scroller滚动卡顿的问题？前端 - uni-app打包web站点，webview在app端如何上传非媒体类型文件？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

minimal-light Eclipse Corrosion Shiretoko NovelHarvester Conceal KAProgressLabel nba-go chan

文档资料

Wish3D earth 开发者文档 v2.2.1 Swoole 中文文档 BeX5 中文开发文档 CPanel 入门教程 Grunt 入门教程