当前位置：首页 > 专题 >

《大数据》专题

用python输入大约8MB的数据
第一行输入包含一个表示测试用例数量的整数T。每个测试用例的第一行包含三个空格分隔的整数-N、x和M，第二行包含N个空格分隔的整数A1、A2、…、an。我使用这种格式来扫描值，但是由于I/O文件大约是8 mb，所以在SPOJ上会给出时间限制。有没有一个能为我提供最快的方式扫描I/P
将超大型数据集导入Neo4j
我有一个庞大的CA的csv数据集。7GB，它有不同类型的列：string和Float。那么将其导入到Neo4J中的超快解决方案是什么呢？我也尝试使用neo4j-admin导入工具，但每次我都被以下错误所困扰： Invoke-Neo4jAdmin:c:\users\shafigh.neo4jdesktop\neo4jdatabases\database-417e361b-f273-496c-983
微服务间共享庞大数据
我正在设计一个微服务架构中的评审分析平台。应用程序如下所示； null null 问题在于，验证服务需要获取site-a的所有评论，应用验证规则并生成错误（如果有的话）。我知道共享数据库模式和实体打破了微服务体系结构。一个可能的解决方案是每当验证服务需要对站点进行审查时，它就会请求网关，网关会将请求重定向到审查服务并采取响应。这种方法的两个可能缺点是验证服务是否知道网关？是否会带来依赖？
如何用H2O处理大数据集
我正在尝试用H2O（3.14）训练机器学习模型。我的数据集大小是4Gb，我的计算机RAM是2Gb，带有2G交换，JDK 1.8。参考本文，H2O可以使用2Gb RAM处理大型数据集。关于大数据和GC的说明：当Java堆太满时，我们会进行用户模式的磁盘交换，即，您使用的大数据比物理DRAM多。我们不会因GC死亡螺旋而死亡，但我们会降级到核心外的速度。我们将以磁盘允许的速度运行。我个人测试过将12G
使用sqlplus检索大型clob数据
null 由于oracle clob字段可以包含4GB(max)的数据，是否有使用SQLPlus获得完整数据块的正确方法？我可以把它作为文件下载吗？我希望问题是清楚的。我更喜欢在不向数据库注入PL/SQL过程的情况下做到这一点。
Java夸大原始数据的异常
我试图用java解码JWT负载，但是这个负载被压缩/压缩了 JAVAutil。拉链DataFormatException:标头检查不正确其他一些使用其他编程语言的人能够用这个解决这个问题，他们想知道我将如何用java实现这一点？
大数据（MapReduce）面试题及答案
介绍下MapReduce ● 1.1 MapReduce定义 ○ MapReduce 是一个分布式运算程序的编程框架，是用户开发“基于 Hadoop 的数据分析应用”的核心框架。 ○ MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并行运行在一个 Hadoop 集群上。 MapReduce优缺点 ● 1.2 MapReduce优缺点 ○ 1.2.
大数据（Yarn）面试题及答案
介绍下YARN ● Yarn 是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。 YARN有几个模块 ● Yarn架构 ○ ResourceManager（RM）： ○ NodeManager（NM）： ○ ApplicationMaster（AM）： ○ Container： YARN工作
字节大数据岗一面-面经
字节面经项目的数据来源和的数据的规模 Spark Shuffle spark的宽窄依赖数据倾斜问题（★★★★★）产生数据倾斜的原因遇到过的数据倾斜的实际情况数据倾斜的解决办法介绍一下hadoop的NameNode NameNode高可用架构 NameNode主节点宕机，之后的选取机制 Zookeeper的选取机制 NameNode中的元数据是否会丢失？（★★★★★）怎么保证元数据不丢
茄子快传大数据一面挂
1.mapreduce的shuffle过程。 2.海量节点的情况下，NameNode如何扩展用多台NameNode保存元数据。 3.多个NameNode，其中一个NameNode挂了，其它NameNode如何上线。 4.海量的（userid,pageid）二元组数据，内存小的情况，用java或者sql计算每个pageid的userid top10的方法？ Java：数据切块并按pageid分区，每
20220905荣耀大数据开发面经
20220905荣耀大数据开发面经写在前面：搬来约在今天下午五点五十的面试，估计是前面的结束的比较快，四点五十给我打个电话让我去面试（当时还在学习室看面经呢/大哭），然后驱车一路彪回去，当时又是军训散场+下课，那叫一g个人多哟，急得不行还是强行镇静/哭算是最近一场比较愉快的面试，面试官人特别好~有说有笑的，在这里记录下，顺便攒攒人品，求offer！！孩子快卷哭了/大哭流程：自我介绍项目难
9.6顺丰面试大数据开发
被kpi了,还是我太菜了 sparkstreaming和flink有什么区别？ sparkstreaming如何确保只被精准消费一次 spark下的执行流程划分？ hivesql平常用的多不多，sql不合理如何进行优化数据库设计的主要的原则平常做项目面临的最大困难是什么，如何解决的反问:工作的业务场景是什么？公司开发中使用的技术栈，回答:hive+es还有个没听清楚
【华为云3面】大数据开发
1面：写题目easy+问基础知识+抓只线程池一直问到了系统资源分配，解答部门做大数据的解决方案，不涉及开发 2面：写题目easy+问简历，全程我在讲，然后没了，反问对我的了解，还说部门主要做解决方案 3面：聊人生，主管很好，推荐一下解决方案部门，感觉主管很年轻，然后给了我意见说做非技术不一定不好，校招生不要带着偏见。整体：3面都是我单方面开摄像头，整个流程很简单，主管面也挺好的，唯一就是不搞技术
大数据开发实习-----欢聚（Hago)
一共两轮技术面一轮HR面，第一轮面试hive 问题居多，第二轮hadoop 问题居多，整体来说问题不是很难，方向为数仓。一面: 11.30下午牛客网面试 30min 自我介绍数仓项目介绍什么是全量表，什么是增量表，以及应用的场景了不了解拉链表，讲一下拉链表如何生成什么是内部表，什么是外部表，有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法讲一下熟悉的窗口函
大数据开发，顺丰一面，23min
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中，说说Action算子和Transform算子的区别？常见的行动算子有哪些？ 4. 这个项目有考虑使用Flink处理吗？ 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议，说说他们的作用 9. 如果

首页

13

14

15

16

17

18

19

20

21

尾页

最新发布

长沙银行货拉拉应用运维实习拼多多面试华为运营经理面经（我跑了）我的面试经历

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

echarts - 如何用echart做一个有厚度的、正面视图的饼图呢？前端 - 求助，如何解决vite.config.js代理配置失效问题?前端 - Ant Design Vue Tree组件拖拽功能中dropToGap和dropPosition的含义是什么？php实现图片序列合成视频？javascript - 为什么节流函数中的定时器ID没有按预期变化？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Script.NET Deis MultiTablesView MiniExcel JasperServer HeyUI Admin jQuery slimscroll maple-bbs

文档资料

Serverless 应用开发指南 Vim 入门教程 AngularJS 中文教程下一代 Web 框架 Koa 快学 Scala 读书笔记