当前位置：首页 > 专题 >

《大数据求职》专题

8. 大数据与机器学习 - Spark
Kubernetes 从 v1.8 开始支持原生的Apache Spark应用（需要Spark支持Kubernetes，比如v2.2.0-kubernetes-0.4.0），可以通过 spark-submit 命令直接提交Kubernetes任务。比如计算圆周率 bin/spark-submit --deploy-mode cluster --class org.apache.spark.
Excel 数据透视表应用大全
Microsoft Excel 的功能真的可以用博大精深来形容。特别是自Excel 2007 在原有的基础上又增加了一些更简单易用的功能。特别是数据透视表功能，更被认为是Excel 的精华所在。本文从创建数据透视表到使用数据透视表查看、汇总、分析数据，还包括数据透视表的布局控制，数据透视表的数据源更新与链接等功能都做了详尽的介绍。
大数据工程师技能图谱
大数据通用处理平台 Spark Flink Hadoop Drill 分布式协调 ZooKeeper 分布式存储 HDFS Alluxio(tachyon) Ignite 存储格式 Parquet ORC CarbonData Kudu 数据库 HBase 资源调度 Yarn Mesos Kubernetes 工作流调度 Oozie Azkaban 机器学习工具 Mahout Spark Mlib
阿里云大数据开发一面
上来20min先做题，两道sql，一道数学，一道概率问数据相关，接触过什么数据库，数据体量，mysql优劣势，mapresduce数据倾斜，hive，sql内置函数自定义函数复盘：熟悉应用场景问答风格无八股，侧重于考察真正理解程度寄。
博世大数据一二面一面
一面英文自我介绍 mr的shuffle zookeeper选举 spark内存管理 hbase中region的拆分数仓中都有什么表怎么处理缓慢变化维，拉链表有用过吗 yarn的架构 namenode ha的实现 namenode启动过程中怎么确定哪个是active哪个是standby spark sql用的多吗手撕中等leetcoode，合并区间二面自我介绍家哪里的对博世有什么了
9.15-华橙网络-大数据开发
最开始发来的邮件说是电话面，当天走完了一面二面，中间只间隔了二十多分钟，当晚HR面，第二天看状态结束了。。。。凉凉这次幸亏是电话面，手机直接录音了，记录的详细一些。一面面试时间：20min 自我介绍？实习工作介绍，实习内容，所用的技术栈。。。怎么和同事配合的？自己有开发了那些？有什么提高？你们这个项目，你觉得还有那些地方可以做优化？离线和实时结合，未来发展的一些看法？ Hive的组成
11.7字节大数据一面已过
1.自我介绍 2.对于岗位理解 3.对于大数据经典组件的简要介绍 4.spark出现明显解决hadoop什么问题 5.sparkrdd的内存管理机制 6.spark提交任务后集群的内存管理机制 7.实习工作介绍 8.谈论对于优化的理解 9.评价方法论，衡量优化工作的指标 10.对于最左匹配原则的理解 11.为什么联合索引的后面字段不走联合索引 12.sql，直播间峰值问题，说了开窗函数排序的思路，
10.12-猫眼-大数据-一面+二面
一面面试时间：70min 自我介绍 Java数据类型？ String builder和String buffer区别？ String为什么是不可变的？为什么要设计成不可变？泛型了解吗？反射了解吗？常用的反射方法？ Java集合类型？数组和链表的区别？讲讲HashMap原理？转换成红黑树条件？为什么这么设计？线程安全的HashMap？ConcurrentHashMap和HashTable
美团大数据开发二面 30min
30min拷打项目，其他八股一点没问，算法和sql也没做。跟我说如果还有后续的话还有一个hr面。怎么就三十分钟啊？不会KPI了吧，许愿许愿许愿
腾讯大数据 Java一面面经
已挂实习时间自我介绍了不了解 go（不了解） redis 为什么快 redis 多线程 redis 实现分布式锁 MySQL 底层索引 B+树事务四大特性分库分表分库分表怎么精准定位 TCP 三次握手、四次挥手 HTTP、HTTPS 的区别 SSL/TLS 消息队列的作用堆和栈的区别（数据结构）了不了解 linux（不了解）线程和进程的区别死锁的概念死锁产生的条件项目反问
完美氪大数据开发面经
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别，并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式，说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快，为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
饿了么大数据一面秒挂？
自我介绍数据结构数组和链表的区别 java中哪里用到了这两个数据结构栈和队列的区别网页的前进和后退都是使用哪个数据结构 arraylist和linkedlist的区别看过哪些书 mysql的索引 b树和b+树的区别，b+树的优点如果使用mysql存1000w行数据，设计方案如果设置索引，那么存储索引也会占用很大的空间，怎么解决数仓的项目，怎么分层的为什么要分层每层干了什么事反
中科软-大数据开发-二面
1.去公司线下面试，有笔试题 1.填资料，个人信息，以及有关职业发展问题 1.比如，你的缺点和优点是什么，对你个人产生怎样的影响？ 2.如果你和他人有不同的观点，你该如何和他人讨论？等等，基本就是情商面笔试题 1.中科软是一家主做保险的外包公司，所以用到的sql主要是oracle, 选择题有几道oracle的题， 2.然后有简答题，也比较简单面试环节 1.自我介绍 2.对于shell部分的提
大家说说----滴滴数据笔试
让我印象最深的是最后SQL，要求是输出一个保留一位小数的比例，题干都没给具体是哪天。题目：运营想知道《某天》的用户中30天后再次打车的占比。（没了）然后给了个表示例：0.4 应该凉了 part1-----行测很少会的，规律是一点找不出来 -1,-2,-1,2,7,(),23 -----()里是什么 part2----excel 如果不熟练，我感觉是每天都用的程度，做的很慢，还不一定对我直
某公司-大数据开发面经
处女面，很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等（项目上写的组件

首页

17

18

19

20

21

22

23

24

25

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10