当前位置：首页 > 专题 >

《大数据求职》专题

如何用java读取excel文件(xlsx)中的大量数据
该编码能够读取excel文件中的小数据...但不读取excel文件中的大数据文件....如何进一步修改代码？
大数据直接从url下载到谷歌云存储桶
如何将数据聚合到范围（存储桶大小）中？
我有一张桌子，比如 as 希望将值聚合或将值条柱到如何在SQL或更具体的spark sql中执行此操作？目前我有一个侧视图，但这看起来相当笨拙/低效。分位数离散化并不是我真正想要的，而是这个范围的。 https://github.com/collectivemedia/spark-ext/blob/master/sparkext-mllib/src/main/scala/org/apache
JFreeChart：条形图X轴标签与大型数据集重叠
在使用JFreeChart创建具有相对较大数据集的条形图时，我面临以下问题：用重叠的X轴标签生成的条形图。我尝试了垂直定位标签，仍然没有帮助。请提供解决此问题的最佳方法。代码剪切如下：更新：根据@trash天的建议，我使用了从0到列计数的Sliding类别数据集索引。当列计数较大（此处为50）时，X标签重叠。当列计数设置为较低的数字时，它工作正常。我想找到大列大小的解决方案。重要的是，我需要将
Cassandra时间序列数据建模和限制分区大小
我们目前正在调查卡桑德拉作为大型时间序列系统的数据库。我已经通读了https://academy . datas tax . com/resources/getting-started-time-series-data-modeling关于Cassandra中时间序列数据建模的内容。我们有许多气象站的高速时间序列数据。每个气象站都有许多“传感器”，每个传感器收集三个指标：温度、湿度和光照。我
在talend大数据工作岗位上创造历史序列
我有一个在塔伦德创建序列的要求。基本上，记录来自源文件。对于每个源行，我希望创建一个唯一的数字。这就是事情变得复杂的地方。当第二天出现新文件时，talend应该选择最后生成的数字，然后用1递增它。对于EX：今天，最后生成的序列号是100。明天talend应该从100生成序列号。即101,102,103,104....这意味着talend应该保留以前生成的最后一个序列号的历史记录。谢谢
如何在JavaScript中处理for循环中的大量数据？
<---JS StackTrace---> =====JS栈迹=================================================================== 安全上下文:0x10178C2CFB51 2:main[/run-N6KBYU8CQZCNEXKH0TBM/solution.JS:~30][PC=0x2859725AEC0](this=0x10178
Kafka流错误：SerializationException：LongDeserializer接收到的数据大小不是8
我正在尝试Kafka Streams。编写一个简单的应用程序，我在其中计算重复的消息。消息：等。我正在尝试通过。用它作为钥匙。然后将其用作值。然后按键分组，查看在每个会话中复制了哪些消息。这是代码： KTable 主题常规生产者生成重复。但是，当我使用控制台使用者查看它时，它会崩溃并显示错误。然后，我在控制台使用者上使用 --跳过错误消息标志。现在我看到成千上万的这样的线条谁能帮帮我这
Cassandra：具有时间戳和大型数据集的表设计
我在一天内查询大量数据时遇到了问题。我正在寻找关于创建一个高效的表模式的建议。
使用php解析html并将大量数据处理到sqlite
我有一个适用于当地交通时间的Android应用程序，例如公共汽车、渡轮和地铁，需要在线和离线工作。当应用程序需要脱机工作时，我需要不断更新其数据库。然而，我没有从市政府获得任何类型的网络服务或数据库。因此，我准备了一个PHP脚本，它将解析市政网页中的html内容，并为每辆公交车、每辆地铁（从哪里到哪里）和每辆渡轮（类似于地铁）的组合提取时间。然而，我的问题是从这里开始的。解析大约10万条记录的所
众安保险大数据开发工程师一面凉经
时间：2022年7月1日面试职位：大数据开发工程师（留用实习生）如题，留用实习生也就是平时说的暑期实习生，有转正机会的实习生面试流程，自我介绍，什么时候能入职，学校的事情都已经忙完了吗，我简单的说了一下情况然后第一问题： ①怎么平衡学校的课程，论文的研究工作，和找工作的时间安排 ②说一说自己的实习经历 ③看到我写电商数仓的项目，介绍一下电商数仓的项目。前面的问题都回答的还好，但是这
【字节提前批-大数据开发工程师-Data 一面】
【字节提前批-大数据开发工程师-Data 一面】 0 面试官自我介绍，介绍面试流程有些奇怪的是首先提到这个岗位不是xxx（记不清原话），偏向开发，询问是否能接受，当时我的理解是：可能这个岗位偏向大数据组件的开发，而我简历里没提及java，所以面试官想知道我是否还愿意继续面试该岗位？随表示接受 1 自我介绍：学校，专业，目前的实习单位和岗位，在校项目简述 2 对实习参与的项目的展开介绍：我实
字节跳动大数据研发实习面经（已上岸）
一面 8.15 45min 0. 现在状况，职业规划 1. 问简历上数据建模的项目 2. 你的理解数据建模应该怎么进行 3. 了解数据库事务吗 4. 主键和唯一索引知道吗 5. 用过hive吗，数据倾斜怎么回事 6. 数据结构/算法怎么样？了解排序吗？哪几种排序？稳定性问题？ 7. 编程题 python 给有3个或更多个数的数组，返回最大能组成三角形的周长 8. sql题简单的group by
美的杭州研究院大数据开发一面面经
面试时长 55min 一位很友善、技术水平很高的大哥面试官自我介绍：来自美的数据库与大数据平台部门。主要做全集团的基础数据平台研发（分大数据平台，数据库平台两个方向）。Spark 部分快忘光了，正好趁这次机会复盘一下！大数据相关：面试官问：Hadoop 和 Spark的区别说一下？ Hadoop的数据处理单位是block，Spark 提供了可供并行处理的数据抽象RDD Hadoop 对数据处
度小满运营数据分析师一面大约凉经
基本不问简历，偏业务和基础知识 1.认为数据分析在行业中的作用 2.sort by和order by的差别 3.采用调研的方式效率低、成本高，怎么从数据角度分析用户画像哪些维度（结合信贷业务） 4.对abtest有什么了解 5.为什么会产生过拟合的情况如何解决 #度小满##面试##数分#

首页

68

69

70

71

72

73

74

75

76

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Spiped OPMS Apache Lucy JQuery4JSF react-native-context-menu-view IndieLib CLTableWithFooterViewController worktop

文档资料

GitHub 漫游指南 Django Book 2.0 中文版 QAP 千牛开发者套件 Scrapy 中文文档 Rails 风格指南