当前位置：首页 > 专题 >

《大数据开发实习》专题

快手数据开发二面凉经 60min
1、自我介绍 2、数仓怎么自学的 3、整个项目架构说一下 4、数据域是什么概念（提到了数据类型），那如何界定数据类型呢 5、总线矩阵构建过程 6、dwd层怎么设计的 7、了解业务过程这个概念吗 8、分域的话，在dws表中有没有可能会跨域（举了个互动域和活动域的例子），结果告诉我这样的话你的互动域设计的其实是有问题的（挖坑给我跳，悲） 9、星形模型和雪花模型 10、缓慢变化纬为什么用拉链表，他说他第
京东数据开发工程师一面
我记得我没有投递过这个部门，但是约的面试是数据开发部门。面试官很好，是我这两周最好的面试官了。 1.自我介绍 2.实习具体工作 3.觉得实习工作有哪些价值 4.自己认为自己有哪些比别人强的优势 5.http/https区别，端口是否可修改 6.get/post区别 7.mysql为什么使用b+树索引 8.秋招目标反问。面试官直接告诉我京东基本没有C++技术栈，90%是java 所以感觉大概
滴滴数据开发一二面 40+40min
一面 1.自我介绍 2.实习经历介绍，负责的项目模块，有多少张表，为什么要做这些表，涉及哪些方面的建设 3.对业务的了解，是你和需求方直接对接吗，参与过砍需求的过程吗 4.模型设计到最后交付的数据开发全流程，有没有中途变更过需求，最终有多少个指标和维度 5.你怎么把这么多维度放到一张表里面呢，oltp引擎怎么样使用的 6.指标都是可以累加的吗，有没有想过把可加的和不可加的指标分别放到不同的表中 7
9-4 唯品会-数据开发二面
问项目根据项目问了一个sql如何写聊七聊八 20min 挂了
字节复活数据开发一面 45min
1.自我介绍 2.项目内容：背景，uv，pv，功能，项目人数，分工 3.数仓的设计思路 4.分层数仓和使用普通数仓的区别 5.为什么ods不直接对接app层，有没有考虑过增加一层数据集市层 6.项目用了哪些技术栈 7.hdfs如何保证高可用 8.hdfs写入数据流程，写入过程中datanode挂了怎么办 9.小文件原因，危害，解决方法 10.数据倾斜介绍，数据倾斜如何排查 11.spark的两种s
8.16汇量科技数据开发一面
介绍开源项目介绍离线数仓可视化用的什么框架 spark的submit的参数了解和做过数据清洗吗数据怎么清洗数据倾斜的优化思路了解scala吗给场景进行去重和选最近一条数据两道代码两数之和数组的小和 1个小时有些忘了
2024字节跳动面试数据开发
#软件开发2024笔面经# 2024字节跳动面试数据岗位 1.模型开发的流程，需求调研过程中有哪些人员参加，调研过程，你会输出什么文档？ 2.如何保障数据质量（准确性）？ 3.spark有什么优缺点？在使用过程如何规避缺点？ 4.spark内存模型？ 5.spark和MR为什么会进行shuffle，如何减少shuffle？ 6.小文件治理的方式？ 7.主题域建设的流程？ 8.大表join大表的优
字节 Data 数据开发面经已凉
#软件开发2024笔面经# 二战字节一面自我介绍介绍实习工作平时做什么数据量多大数据仓库理解怎么分层的 Spark执行流程 Spark内存划分 SQL优化方式布隆过滤器 JVM内存模型垃圾回收双亲委派 SQL题连续登录算法题 LRU 二面自我介绍介绍实习数仓为什么分层主要解决什么问题两道算法题链表删除元素和在数组中快速查询数据布隆过滤器半连接查询 gro
网易数据开发5.14一面已过
1.自我介绍 2.实习关注准确性和效率等指标的权衡 3.项目 4.sql全勤员工两天没消息了忍不住打电话问了，hr接起来电话来第一句“你是浙大同学吧，我们交叉面隔壁部门面试官忙” ？？？？浙大去网易干外包做数开？？？？？我是不能理解
众安保险数据开发一面 25min
最难绷的一集，感觉KPI面 1.自我介绍 2.介绍项目，你这不就是最普通的广告曝光么，有什么区别，客群标签是你们加工的吗，数据流图是什么，有啥用 3.项目难点，业务上的难点，你这种方法也没解决业务的难点啊（我真难绷，业务对接过程的问题我咋解决，我最多减缓） 4.介绍hive or spark 5.数仓开发的关键点，每一层的作用 6.反问：我终于说出了那句一直想说但不敢说的“我没有什么问题要问”，润
5.30腾讯数据开发一面面经
游戏开发——数据工程，50分钟问的都是八股四类访问权限；四种内部类；反射机制；JMM内存模型；ArrayList和LinkedList；final VS finalize VS finally；两道编程题：有序列表合并；最长回文串等消息
实战7：PostgreSQL JSON数据类型大探
1. 前言在正式的小节学习之前，我们先来探讨一个问题，你究竟是否有必要使用类似于MongoDB这样的文档性数据库？这些年，NoSQL以及NewSQL都刮起过一番浪潮，而SQL终究还是岿然不动，不仅没有被打垮，反而变得更加大。PostgreSQL号称世界上最先进的关系数据库，很早的时候便已经开始支持文档性数据类型了，而且在9.3以后的每一个版本，都提供了更多的新特性。 PostgreSQL 最重
TCL实业大数据工程师面经
9.11 一面 35min： 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
3.15 杭州大应科技后台开发实习一面面经
发面经攒人品#投递实习岗位前的准备##我的实习求职记录##实习，投递多份简历没人回复怎么办#
百度-大数据研发工程师面经
一面 redis： RDB和AOF的区别 AOF中记录的是什么，RDB中记录了什么过期数据的删除策略使用这些删除策略可能会出现哪些问题定期删除是所有数据删除吗内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别为什么用单线程不用多线程 clickhouse（实习里用的主要是这个）：简单介绍一下clickhouse，说说为什么用这个说一下R

首页

28

29

30

31

32

33

34

35

36

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档