当前位置：首页 > 专题 >

《一面数据》专题

SHEIN 数据开发一面
自我介绍什么是数据仓库，和数据库有什么区别？数仓是怎么构建的？（然后开始细抠项目的内容，可怕） Hive的存储格式有哪些？实习做了什么工作？有哪些难点？为什么离职？（寒冬哪有我的位置？） Spark和Flink的区别是什么？（简单说了一两点，感觉不是面试官要的答案） Spark Streaming接收Kafka数据的两种方式？（这题真不会）都学过哪些专业课程？结束整个流程挺快的，会就是
金蝶大数据一面
#软件开发2023笔面经# 个人感觉是根据简历内容来的，尤其是项目，简历涉及大数据，神经网络，数据库数据库范式SQL和NoSQL 的区别，各自的优缺点 Hive 数据结构特点 Hive 导入数据有哪几种方法 Hive 和 Hbase 区别 Python 和 Java 区别，特点说一下这个神经网络，搭建过程，激活函数为什么选这个 HBase数据结构特点，Hbase 的优缺点说一下TextCNN
Cider-数据科学一面
问题： 1. sql和python用得怎么样 2. sql小问题：分组求和的两种写法 3. 缺失值处理的思路，用到的函数 4. 实习期间做的有意思的一件事 + 模型细节追问 5. 异动分析：近七日GMV下降怎么分析 6. 选择一个分析角度详细选取指标进行分析反问： 1. 目前的业务方向 2. 转正标准和流程 3. 偏好的候选人特征挖得蛮细的，但技术问题考得不难，主要看分析思路和沟通能力。另，他
TapTap-数据开发-一面
项目，根据项目问一些八股略记录没答好的 mapreduce的shuffle算法有哪些？ mapreduce说的时候忘记切片过程了，导致后面问map分区数懵了，这都能忘废了雪花和星型模型的区别，我只答了join和冗余，没答全
百度大数据一面
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现写一个sql，学生不同学科的得分排名前三手写单例模式，策略模式，工厂模式，并描述在什么场景下使用，口述一下装饰者模式 arraylist和linkedlist的区别，什
京东大数据一面
hdfs读写流程 spark内存管理项目中遇到的问题，怎么解决的项目中都有哪些表怎么处理缓慢变化维拉链表怎么做，开链闭链怎么数仓和数据湖维度建模，星型模型，雪花模型数据倾斜，小表join小表，大表join大表遇到过的数据倾斜，怎么做的手撕，二叉树中序遍历，非递归写法
快手大数据一面
数据倾斜问题写个sql吧再写一个sql吧，写挺好啊，在写一个吧这些你是练习过原题吗，在写一个sql吧说一下数仓的分层，每层干了什么事？说一下归并排序的过程 xgboost原理线性回归，逻辑回归聚类了解吗说一下spark怎么实现map join
tplink数据开发一面
1.问实习问项目问成绩 2.机器学习算法了解哪些，分类算法？特征工程？ 3.kafka原理，spark优势反问：业务技术有哪些—离线实时都有，和国外电商有关总结：时间较短二十分钟，比较轻松，不知道有没有二面
百度大数据一面
自我介绍专业课程、成绩是否学过计算机专业课（408）线程、进程的区别编译型语言和解释性语言区别、使用场景计算机32位、64位存储空间多大 Java内存存储 Linux通过文件名、文件内容查找介绍Redash 比较ClickHouse、Doris和Mysql架构、使用场景和优缺点 b+树的优势实习主要工作反问：如何使用好一个数据模型对我的建议
百度大数据一面
自我介绍深挖实习经历（介绍实习主要工作、场景复盘等等延伸） hive相关（hive原理、hive sql区别）数据倾斜的常见case ClickHouse相关 group by原理 left join与right join区别与特点主要技术栈对岗位的理解反问：部门与产品业务线校招生定位
大数据开发一面
腾讯会议一面(30分钟) 自我介绍项目介绍数据如何采集，整个流程叙述一遍项目难点说一下两个项目的区别讲一下数仓分层里面的表叙述一下有什么分析一下两个事物之间的关系，怎么分析(有点抽象的问题)，有什么经验
小米大数据一面
1.自我介绍 2.熟悉flink还是spark 答：flink 3.介绍下flink架构吧答：这里越深越好，我就讲到了flink的jobmanager(dispathcer，jobmaster)和taskmanager 4.flink有哪些算子? 答：map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。 5.fl
百度大数据一面
自我介绍实习工作介绍事实表与维度表如何搭建星型模型与雪花模型维度冗余业务场景理解数据倾斜原因和常见手段手撕一道sql：连续登录7天用户两道算法：二维动态规划 n! 尾数0的个数
百度大数据一面
4.27 1h B2B，百度电商部门介绍完自己直接开始写算法题随机数据的峰值，如 1 2 3 6 5 8 7，返回 6 或 8都行，要求时间复杂度O（lgN）斐波那契数列，要求时间复杂度O（lgN），矩阵解法求两个字符串的最长公共子串，如 abcedfgh 和 bcedgh 最长公共子串是bced 求两个字符串的最长公共子序列，如 abcedfgh 和 bcedgh 最长公共子序列是bce
字节大数据岗一面-面经
字节面经项目的数据来源和的数据的规模 Spark Shuffle spark的宽窄依赖数据倾斜问题（★★★★★）产生数据倾斜的原因遇到过的数据倾斜的实际情况数据倾斜的解决办法介绍一下hadoop的NameNode NameNode高可用架构 NameNode主节点宕机，之后的选取机制 Zookeeper的选取机制 NameNode中的元数据是否会丢失？（★★★★★）怎么保证元数据不丢

首页

1

2

3

4

5

6

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

awesome-datascience libpcap safe-start-koa2 Workerman smart-servlet Eurasia bLazy.js Vertical Swipe Views

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10