我们不确定从这里到哪里去,完全被困住了。有人能帮忙吗?我们到处找了一些例子来帮忙。
字节大数据开发工程师- 人力科技面经 一面 网络模型,每一层的功能 访问一个网页的流程 tcp是如何保证可靠 线程和进程的区别 JVM的内存区域 垃圾回收算法 类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag,job,task是如何划分的 spark宽窄依赖 为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
1、自我介绍 2、什么是维度建模?什么是关系建模? 3、星型模型和雪花模型有什么区别? 4、数据仓库分层的意义是什么? 5、对哪些大数据框架比较熟悉?(答了Hadoop和Kafka) 6、Hadoop的进程有哪些?作用分别是什么? 7、Kafka的特点是什么? 8、Kafka为什么可以支持海量数据吞吐? 9、问实习工作内容,以及实习收获 10、能否接受加班? 11、有什么问题要问我的?问了日常工作
去年秋招拿了携程-大数据底层框架开发岗位的offer,想着还是把面试回顾下吧,给后面的朋友一个参考。 这个岗位是做大数据组件底层二次开发的,我面试的是偏向离线方面,因此面试都是围绕hadoop、spark、hbase、hive这几个组件的底层原理去问,因为是偏向底层,所以也会注重java语言和多线程并发的知识。 HDFS的写入流程?如果一台机器宕机,HDFS怎么保证数据的一致性?如果只存活一台机器
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 注意这是日常实习!!! 1.自我介绍 2.刷题 冒泡排序 3.八股文 3.1 JVM JVM的内存结构 类的加载过程 静态代码块和代码块初始化的顺序,以及静态代码块在哪个阶段被加载【初始化】 垃圾回收器 一个方法报错了,怎么进行分析,比如A方法调用B方法,B方法调用C方法....【没太懂】 3.2 并
离线数仓项目介绍 hdfs读流程 hdfs 中datanode怎么与namenode交互 mr过程 hive数据倾斜,介绍原因和解决方案 介绍一下网络结构,tcp在哪一层 java有哪些集合类 介绍java接口 MySQL索引 数据结构(B+树) 反问 上海银行数仓技术框架
笔试从晚上7点到9点,时长2h,总分100分,单选25题共50分,三道编程题,分值分别为15,15,20分,在牛客考试平台,可以用本地IDE。 鼠人这次笔试又寄了,刷kpi了。 单选题考察的内容五花八门,有java基础,操作系统,计算机网络,数据库,智力题。好多不会的,加上今天去医院做了龈下刮治,做的时候很困,迷迷糊糊地做完了。 编程题第一题满意数字,给出自然数n,问用1,2,3,4的组合加起来等
清华大学开源软件镜像站,致力于为国内和校内用户提供高质量的开源软件镜像、Linux 镜像源服务,帮助用户更方便地获取开源软件。本镜像站由清华大学 TUNA 团队负责维护。
1 介绍下你自己 我按照常规的套路,先自我介绍,然后介绍我的项目,想引导着问些八股,但是好像没用😂 2 32位和64位你能联想到什么,从机组操作系统,数据结构等角度,开放性的谈一下你的理解😂😂 这个问题直接问了15分钟 3 手撕代码 给你一个应用场景,设计合适的数据结构,并完成两个功能函数 看出来是树了😂😂,但是没咋刷算法,以为只问sql,我的格局小了,写了二十分钟,一点不会😂😂 总
1.数仓和数据库的区别 2.数仓建模 3.hive用到的函数 4.rank,dense_rank,row_number的区别 5.hive数据倾斜的原因有哪些 7.如何理解数据质量? 6.java,scala会用吗? 7.期望薪资多少?(感觉说出来就无了) 面的初级岗位。
🌟🌟7.10 投递 1️⃣7.12 电话一面 20min ‼️1.为什么转码呀,当时怎么考虑的? ‼️2.有哪些offer了?测开方面了解哪些内容呀? ‼️3.现在有个招聘系统,它只有接口没有页面,对添加候选人模块设计一个测试用例?(这问题答的一般,没回答到点上) ‼️4.测试用例设计方法有哪些? ‼️5.其实刚才第3个问题问的是纯粹的接口,可以用jemter进行测试吗? ‼️6.那用jemt
有幸收到阿里大文娱的实习一面,面试官是个很温柔的姐姐,下面记录一下问题: 1.自我介绍 2.说一下你的两个项目,挑一个讲(我挑了Flink相关的一个项目讲) 3.checkpoint怎么做的 4.exactly-once的语义是怎么实现的 5.你了解反压吗? 6.在校课程会学什么 7.你是怎么理解数据科学的?(科学的去获取、存储、处理、分析、挖掘数据) 8.你提到数据分析,你可以讲讲数据分析的思路
选择题(15道): 以xx为基准的一趟快排后的结果 分块查找的比较次数 给定入栈元素计算出栈序列的可能性 简单无向图的邻接矩阵零元素数量 哈夫曼编码一个字符串所需的编码长度 ping没有用到的网络协议 操作系统创建进程的过程 电话号码前缀查重需要的内存 (别的忘了,整体还好,纯408真题) 填空题(5道): 二叉排序树的查找 多线程的四种同步方式 IP子网划分求掩码 (别的忘了,都不难) 简答题(
项目为sgg经典离线数仓 1. 自我介绍 2. 项目介绍(难点、亮点) 3. 根据难点亮点提问 4. 数据域是什么,如何划分数据域,为什么这样划分数据域 5. DIM层维度表的设计原则 6. DWD层事实表设计要点 7. mapreduce shuffle流程 8. maptask和reduce task 与哪些因素有关 9. 数据热点(数据倾斜)在哪些场景下出现,如何解决 10. spark是为
2022年秋招时面过浙江大华的后端开发岗(Java),二面后没下文了。今天整理电脑文件时意外发现当时记录的面经,在此进行分享。 一面 面试形式:电话面 面试问题: 介绍实习项目? 实习项目的团队分工和个人职责? SpringBuffer和SpringBuilder的区别是什么? 常用的集合类有哪些?HashMap的底层数据结构?推荐一下线程安全的Map? TCP和UDP的差异是什么? MySQL的