当前位置：首页 > 专题 >

《大数据开发面经》专题

大疆测开二面凉经
1、介绍课题项目，主要考察解决问题能力和创造力，面试官不懂，就是考察能力 2、一段数字信号处理实习，主要还是问我的编程能力 3、python掌握能力，线程和进程的区别；浅拷贝，深拷贝，手机内存128G+8G分别是什么意思，软件的操作系统，计算机相关的知识有没有 3、五年职业规划，我说我想做硬件的，问我为什么不投递互联网，我说我想做制造类企业的，这不是主打一个不匹配了大疆我是真的属于最后快结束投递
Ajax不会发布大图的base64数据
问题内容：我正在通过ajax将Image base64数据传递给我的php函数，但是对于大尺寸图像，Ajax不会发布数据。但是，相同的代码对于小图像非常适用。数据太大，因此部分发布了， ajax PHP 当我尝试获取php中的发布数据时，我越来越空了。使用base64时，ajax不发送数据的原因可能是什么？问题答案：我同意TrueBlueAussie的观点。这看起来像PHP中的服务器端设置
数字马力后端开发一面二面面经（社招）
时隔1年，甚是感慨，没想到这么快又来面试了。一面（30分钟）2023.07.10 自我介绍能简单说一下用了哪些设计模式能简单描述一下策略模式吗？策略模式和if-else有什么区别，怎么定义策略类的 Linux在一个目录下面，有100个文件，需要匹配以 ‘query’ 开头的日志，并且把数量统计一下，用什么命令（grep -c '^query' /path/to/directory/*） J
顺丰-大数据挖掘与分析面经
顺丰-大数据挖掘与分析（2021秋招）顺丰一面： 1.深挖实习，指标体系如何建立，各项指标的权重如何确定 2.逻辑回归算法的原理 3.谈谈对ABtest的认识 4.sql排序窗口函数的区别顺丰二面： 1.深挖实习，预测为什么选用随机森林算法，如何调参 2.论文项目，简单介绍 3.了解哪些机器学习算法 4.反问顺丰hr面 1.实习中遇到的困难，如何解决 2.过往经历中，你认为最困难的问题，你是
猿辅导——大数据平台面经(凉经)
二面 1、为什么用seatunnel进行同步，不用dataX？ 2、seatunnel底层引擎是spark，那为什么不直接用原生的spark进行同步呢？ 3、项目有什么做的不够好的？ ODPS相当于hive，多进程写入会产生表锁，没法利用spark的并发优势——1.统一管理ODPS表，每个分区写入一张表，读取的时候直接读取表，然后每天定时进行聚合。这个过程对于用户来说是无感的。2.分布式锁，阻塞的
字节大数据二面寄，已经香菇
二面40分钟左右结束，没问项目问对kafka、数仓分层理解在学校干啥了，学习大数据的途径方式然后就是两个类似场景题目，讲思路不用写代码一个是大数据单机处理:对10Tb数据全局排序一个是判断链表相交第一个回答的💩一样，第二个还好第二天收到感谢信😭 #面试# #大数据# #字节#
面经|快手数据研发实习生二面
1.Spark执行流程 2.HDFS的读写流程 3.HDFS在读流程中最适合的副本是哪个 4.对数仓的理解 5.数仓分层的作用 6.说一个你觉得有挑战性或者复杂性的数据倾斜的例子 7.选一个项目拷打反问整体33mins左右
泸州老窖研酒生数据开发岗（测评+一面）
春招流程：网申---->测评--->初面---->复面----->发offer 网申：除了正常的个人信息外还需要写点小作文夸夸泸州老窖，然后写为什么要选择泸州老窖什么的，总体来说网申淘汰率不高测评：前一天刚网申，第二天就发了测评链接，题目主要是一些申论形策+智力题+性格测试题，难度不高，好好写问题应该也不大初面：测评完当天晚上就给我发了初面短信，先测试设备，然后发正式初面的腾讯会议的链接和会议
滴普一面大数据测试 10.13
群面（轮流技术面，还好）（4候选者+1hr+1负责人+2技术面试官） 1.自我介绍 2.问测试项目（好久没看了，记不清。。。） 3.输入网址到出现页面的过程？ 4.DNS 6.什么是合理的测试用例？ 7.为什么想要做测试？未来的职业规划？ #秋招##测试#
大数据（MapReduce）面试题及答案
介绍下MapReduce ● 1.1 MapReduce定义 ○ MapReduce 是一个分布式运算程序的编程框架，是用户开发“基于 Hadoop 的数据分析应用”的核心框架。 ○ MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并行运行在一个 Hadoop 集群上。 MapReduce优缺点 ● 1.2 MapReduce优缺点 ○ 1.2.
大数据（Yarn）面试题及答案
介绍下YARN ● Yarn 是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。 YARN有几个模块 ● Yarn架构 ○ ResourceManager（RM）： ○ NodeManager（NM）： ○ ApplicationMaster（AM）： ○ Container： YARN工作
茄子快传大数据一面挂
1.mapreduce的shuffle过程。 2.海量节点的情况下，NameNode如何扩展用多台NameNode保存元数据。 3.多个NameNode，其中一个NameNode挂了，其它NameNode如何上线。 4.海量的（userid,pageid）二元组数据，内存小的情况，用java或者sql计算每个pageid的userid top10的方法？ Java：数据切块并按pageid分区，每
美团大数据基架一面20230407
1小时，全程 LSM tree 深挖 LSM-tree 存储引擎和 Raft 的关系 LSM-tree 原理和特点为什么要追加写 LSM-tree 的工业实现 LSM-tree 的合并方式（合并超出阈值的部分还是全部？优缺点 Bloom filter 的实现 Bloom filter 如何持久化缓存的索引怎么做缓存淘汰缓存的索引一个 SSTable 对应一个 map 和用一个全局 map 的
11.7字节大数据一面已过
1.自我介绍 2.对于岗位理解 3.对于大数据经典组件的简要介绍 4.spark出现明显解决hadoop什么问题 5.sparkrdd的内存管理机制 6.spark提交任务后集群的内存管理机制 7.实习工作介绍 8.谈论对于优化的理解 9.评价方法论，衡量优化工作的指标 10.对于最左匹配原则的理解 11.为什么联合索引的后面字段不走联合索引 12.sql，直播间峰值问题，说了开窗函数排序的思路，
饿了么大数据一面秒挂？
自我介绍数据结构数组和链表的区别 java中哪里用到了这两个数据结构栈和队列的区别网页的前进和后退都是使用哪个数据结构 arraylist和linkedlist的区别看过哪些书 mysql的索引 b树和b+树的区别，b+树的优点如果使用mysql存1000w行数据，设计方案如果设置索引，那么存储索引也会占用很大的空间，怎么解决数仓的项目，怎么分层的为什么要分层每层干了什么事反

首页

38

39

40

41

42

43

44

45

46

尾页

最新发布

完美世界用户研究员一面凉经社招 SAP WTA 一面好未来大模型日常实习生（2024.01.04）Using AI一面 1.10虾皮搜索美团大模型面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

javascript - 浏览器正常返回结果但是 Axios TypeError: Cannot read properties of undefined (reading 'protocol')？javascript - 财务系统，js精度问题怎么解决？webpack5 - DllPlugin 打包后的文件在 Webpack5 中如何被浏览器加载？可以通过点击服务号菜单项打开体验版小程序吗？vue.js - 用vue使用原生table标签如何实现图中效果？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

VirtuaWin chronospy LittleD ExcelReport NutUI BadgeView Open Icon Library 小说精品屋-微信小程序

文档资料

Symfony2 Cookbook 中文版 NTLM 中文文档 PHP 语言规范 Beautiful Soup 4.4.0 中文文档 Netty 4.x 用户指南