当前位置：首页 > 专题 >

《大数据开发工程师》专题

京东方大数据面试
7.22一面 spark的底层原理 spark yarn client和yarn cluster的区别 dataframe如何创建数仓项目中用了几个节点，各个组件如何部署的 HA介绍一下数仓分层介绍 hadoop的一些命令 hadoop如何更改文件所有者 kafka的监控 linux命令，vim编译器的命令集群间节点是如何通信的 core-site文件一般配置什么内容 ranger权限管理的
万兴科技 23大数据
9.17 HR面素质面 15分钟基本上跟二面差不多，说要横向比较一周后给结果。 ----- 9.14 二面素质面 40分钟 1.为什么工作后去考研 2.你觉得数据开发的这份工作价值在哪里 3.你对万兴科技了解多少 4.你未来三年的职业规划是什么样的 5.你的项目的背景、价值、开发过程、开发人数、你扮演什么角色，你的价值体现在哪里基本上没有技术问题，都是素质考察。 ----- 9.9 一面
大华数据挖掘面经
硕士研究cv 可能和数据挖掘不是那么匹配~ 大华一面（1h）： 1、增量学习的科研项目（问了具体的细节以及为什么） 2、语义分割的发展 3、UNet中的跳跃连接的作用 4、残差网络的shortcut连接的作用，数学方面证明残差网络可以避免梯度消失，并且问了一个关于残差网络的改进问题（面试官看最新的论文看到的，我没有理解他所说的问题） 5、宫颈肿瘤分割和pcr预测的项目（细节也问的很详细） 6、预
数据挖掘十大算法
数据挖掘通常与计算机科学有关，并通过统计、在线分析处理、情报检索、机器学习、专家系统（依靠过去的经验法则）和模式识别等诸多方法来实现上述目标。
第15章大数据与MapReduce
大数据概述大数据: 收集到的数据已经远远超出了我们的处理能力。大数据场景假如你为一家网络购物商店工作，很多用户访问该网站，其中有些人会购买商品，有些人则随意浏览后就离开。对于你来说，可能很想识别那些有购物意愿的用户。那么问题就来了，数据集可能会非常大，在单机上训练要运行好几天。接下来：我们讲讲 MapRedece 如何来解决这样的问题 MapRedece Hadoop 概述 Ha
10.14-东方电子-大数据
面试时间：30min 自我介绍 HR常规询问，成绩排名、英语六级、籍贯、家庭、独生子女，高考分数。研究生日常，工作学校都是怎么安排的？实习日常，加班情况？实习项目介绍，背景，技术栈？ Lamda架构介绍？为什么这么设计？流批一体概念？技术选型考虑的问题？选择OLAP数据库的依据？Clickhouse介绍？研究方向介绍，论文情况，模型和创新点？工程落地？对公司的意向度？反问：部门业务？
美团大数据一面凉
自我介绍手撕，股票最大利润 sql 成绩排名三数仓分层数据倾斜遇到的问题为什么要分层分析了哪些指标介绍一下spark 介绍一下hadoop 介绍一下hbase 反问不知道哪的问题，又凉了面了这么多0offer
大厂数据中台建设
主要内容：1.现有数据存在的问题,2.系统架构1.现有数据存在的问题 1.1 开发数据服务门槛高数据开发工程师除了开发完数据表外，通常还需要思考如下问题：数据如何交付：业务通常期望使用数据接口方式来使用数据，而非数据表，这会更加灵活、解耦、高效。数据开发工程师因此需要建立对应的数据服务服务如何开发：数据服务有多种形式，通常要求开发工程师有微服务知识、服务发现注册、高并发等权限、可用性问题：开发完数据服务后，需要考虑权限问题，确保数据资
字节 data 大数据四面
update: 9.30 约 10 月中旬 HR 面了，许愿 OC 🤗 --- 9.29 字节四面，问了 HR 四面技术好像是这个部门的正常情况😅，I'm like, well... - 自我介绍 - 上来先做了一道题：Leetcode 解码方法（动态规划） - 实习具体负责哪些工作，占比是怎样的 - 你们数仓团队几个人，数仓怎么分层、分主题 - 分层的意义 - 你在商品域的工作中是否会涉及边
字节 data 大数据二面
9.12 一面结束后半小时飞速约了二面，9.14 二面 - 自我介绍 - 为什么读研 - 为什么转专业 - 你对大数据的理解 - 介绍一下实习组内的分工、数仓架构 - 以商品域为例，数据的模型/表有哪些，从哪些角度评价数据模型 - 你们组具体的宏观的业务流程 - 具体是怎么和其他部门协作的，流程是怎么样 - 你是怎么理解数开的工作的，你个人的偏好是哪方向 - 数据库的范式、事务 - 范式建模、维度
字节 data 大数据三面
中秋假期所以二面三面间隔了挺久的，9.23 三面，面试时间很短，35 分钟左右 - 自我介绍 - 实习介绍 - 看你做了很多任务优化，讲讲优化的思路，从哪些方面去考虑 - 介绍一下 Cube 表去重优化 - 介绍一下***识别项目 - 你们商品维表数据量 - 你们实习部门的数仓分层 - 用户域和流量域的区别 - SQL：今天登录但昨天没登录的用户 - 算法：二叉树层序遍历，自己构造输入输出 - 你
字节大数据商业化
1.数据分层概念 2.Hadoop 和spark 优缺点 3.数据倾斜场景题大表和小表join 4.宽窄依赖 5.sql题 6.走楼梯算法 7.hive的用户自定义方法区别
Redis：显示数据库大小/密钥大小
问题内容：我的redis实例似乎正在变得非常大，我想找出我那里的多个数据库中的哪个消耗了多少内存。Redis的命令仅向我显示了每个数据库的总大小和密钥数，这并没有给我带来太多的了解…因此，在监视Redis服务器时为我提供更多信息的任何工具/想法都将受到赞赏。 Redis文档没有显示任何可以返回某些键消耗的内存的命令，因此我想如果有错误代码会为Redis写很多“废纸t”，这可能很难找到… 问题答案
浙江大华大数据提前批面经
中午两点打过来，我说暂时没空约了晚上八点面试时间控的很准，也没有反问就结束了一面15min [项目]- [ ] Linux起一个服务端的过程 -[ ] 使用哪种epoll工作方式 - [ ] 水平触发与边缘触发编写时要注意些什么 - [ ] 多进程如何通信 - [ ] fork如何判断父子进程 - [ ] 虚函数的作用 - [ ] 虚函数的使用场景 - [ ] 了解的C++智能指针 - [ ]
大华C++一面（大数据研究院）10.23
面试官介绍了一下部门主要业务（数据挖掘、分布式存储、机器学习、虚拟化）动态多态的实现原理虚函数表是属于类的还是类对象的静态成员函数可以是虚函数吗为什么析构函数默认不是虚函数内存对齐的作用 vector和map用迭代器一边遍历容器一边删除元素，迭代器会失效吗 map是有序的还是无序的，底层实现是什么 map为什么底层实现是红黑树而不是AVL IP层有MTU报文分段策略，那TCP是不是可以不

首页

87

88

89

90

91

92

93

94

95

尾页

最新发布

影石360 AI平台开发一面手子感谢信山东移动一面面经 PDD四面面经不鸣科技 - ai工程师一面抑郁经验

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

30. 串联所有单词的子串 c++自己解答无法通过,可以帮我看看代码错在哪里吗？web - 在Deepin23系统中设置虚拟域名，但在浏览器中无法访问？amh - 7.2版本的集中管理服务器列表非常不方便可以优化一下么？javascript - vue input 文件上传为什么@change不触发？vue.js - Vuetify 框架怎么查看有哪些CSS 类名，如何查询？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

XMMultiSelectView JEECG Multiavatar OneVideo Habitica 猪齿鱼 Choerodon jekyll-dash Gudong

文档资料

Internet Explorer 维护帮助手册 Spring Boot 中文教程廖雪峰 JavaScript 教程 Canvas 实操教程 F-Secure Policy Manager - 管理员指南 v13.10