当前位置：首页 > 专题 >

《大数据开发》专题

11.7字节大数据一面已过
1.自我介绍 2.对于岗位理解 3.对于大数据经典组件的简要介绍 4.spark出现明显解决hadoop什么问题 5.sparkrdd的内存管理机制 6.spark提交任务后集群的内存管理机制 7.实习工作介绍 8.谈论对于优化的理解 9.评价方法论，衡量优化工作的指标 10.对于最左匹配原则的理解 11.为什么联合索引的后面字段不走联合索引 12.sql，直播间峰值问题，说了开窗函数排序的思路，
10.12-猫眼-大数据-一面+二面
一面面试时间：70min 自我介绍 Java数据类型？ String builder和String buffer区别？ String为什么是不可变的？为什么要设计成不可变？泛型了解吗？反射了解吗？常用的反射方法？ Java集合类型？数组和链表的区别？讲讲HashMap原理？转换成红黑树条件？为什么这么设计？线程安全的HashMap？ConcurrentHashMap和HashTable
腾讯大数据 Java一面面经
已挂实习时间自我介绍了不了解 go（不了解） redis 为什么快 redis 多线程 redis 实现分布式锁 MySQL 底层索引 B+树事务四大特性分库分表分库分表怎么精准定位 TCP 三次握手、四次挥手 HTTP、HTTPS 的区别 SSL/TLS 消息队列的作用堆和栈的区别（数据结构）了不了解 linux（不了解）线程和进程的区别死锁的概念死锁产生的条件项目反问
饿了么大数据一面秒挂？
自我介绍数据结构数组和链表的区别 java中哪里用到了这两个数据结构栈和队列的区别网页的前进和后退都是使用哪个数据结构 arraylist和linkedlist的区别看过哪些书 mysql的索引 b树和b+树的区别，b+树的优点如果使用mysql存1000w行数据，设计方案如果设置索引，那么存储索引也会占用很大的空间，怎么解决数仓的项目，怎么分层的为什么要分层每层干了什么事反
大家说说----滴滴数据笔试
让我印象最深的是最后SQL，要求是输出一个保留一位小数的比例，题干都没给具体是哪天。题目：运营想知道《某天》的用户中30天后再次打车的占比。（没了）然后给了个表示例：0.4 应该凉了 part1-----行测很少会的，规律是一点找不出来 -1,-2,-1,2,7,(),23 -----()里是什么 part2----excel 如果不熟练，我感觉是每天都用的程度，做的很慢，还不一定对我直
汇量科技大数据2023-02-07
1.自我介绍 2.项目 3.问项目有没有遇到数据倾斜怎么处理项目有没有OOM怎么处理项目有没有遇到数据丢失怎么处理 4.lc全排列
百度-大数据工程师一面
#百度#面试官很好，总体感觉问的比较简单，但是好久不看八股感觉很多都忘记...理解还是比较浅层，一些实战方面的内容还比较欠缺...要努力了！！！
顺丰9.10大数据一面凉经
9.7做的笔试，9.10武汉地区线下面试总共三十分钟左右，面试官技术很强，人也很nice 体验很好。主要拷打的项目和八股，问得很底层，感觉八股答的不好应该是寄了自我介绍；问了实习，主要做的工作内容；项目架构，数据流，涉及到的组件，为什么选择，不同源的数据怎么汇总，项目的数据量是多少； flink的check point机制，存储位置； kafka的架构，用了多少个节点； Hbase的结构
爱奇艺风控大数据一面
介绍项目，聊项目哈希场景 spring Bean创建流程 spring事务注解，参数平常中碰到过的事务问题，使用什么解决事务问题求两个有序数组中不重复元素的个数
多个不同列数的数据帧合并为一个大数据帧
我有两个不同列数和行数的CSV文件。第一个CSV文件有M列和N行，第二个文件有H列和G行。一些列具有相同的名称。 null 另外，如果两个CSV文件有两个数据帧，并希望这样做，例如，如果我将第一个CSV加载到中，将第二个加载到中，然后希望合并到，类似于上面的示例。
在Node.js中通过HTTP发送大图像数据
问题内容：在我的开发环境中，我有两个服务器。一个通过http请求将图像发送给另一个。客户端服务器执行以下操作：收到请求的服务器执行以下操作：如果我发送小图像，则效果很好。但是，如果我发送了较大的图像，尽管文件保存正确，则仅显示图像的第一上部。其余为黑色。图像尺寸正确。我想这只是文件中写入的图像的第一块。我尝试创建一个和一个，但似乎不起作用：我可以直接从二进制数据流传输到文件吗？对于我所
顺丰科技｜大数据平台研发｜一面
了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
顺丰（大数据研发）：一面+二面，凉经
### 一面自我介绍+实习经历 (31608)### 二面 1. 自我介绍 2. 实习经历，我说了JVM的重用 3. JVM重用的底层原理 4. sql输出排名前七的学生 5. hive处理小文件的方式 6. hive组件，原理 7. hiveSQL转化为mapreduce的执行过程 8. hive执行过程中的优化 9. 为什么使用环形缓冲区 10. HDFS组件 11. secondnamen
如何增加MySQL的最大允许数据包大小？
我遇到了MySQL的问题。我收到错误。关于StackOverflow,他们说MySQL配置中的很可能太低。我尝试在中更改它，但该文件是不可编辑的。不能在PA上使用。我正在使用Sqlalchemy处理与MySQL服务器的交互。我能做什么？
6. 大规模计算的策略: 更大量的数据
校验者: @文谊翻译者: @ゞFingヤ对于一些应用程序，需要被处理的样本数量,特征数量（或两者）和/或速度这些对传统的方法而言非常具有挑战性。在这些情况下，scikit-learn 有许多你值得考虑的选项可以使你的系统规模化。 6.1. 使用外核学习实例进行拓展外核（或者称作 “外部存储器”）学习是一种用于学习那些无法装进计算机主存储（RAM）的数据的技术。这里描述了一种为了实现这一目的

首页

36

37

38

39

40

41

42

43

44

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档