当前位置：首页 > 专题 >

《大数据开发面经》专题

中信银行大数据中心数分一面面经
背景：双211，研究方向：计算机视觉（遥感变化检测）一志愿：AI算法（应该是挂了一志愿）二志愿：数分 10.26上午腾讯会议视频面试 1个hr/3个面试官 1.自我介绍 2.有没有实习？ 3.介绍一个项目所做的工作 4.技术栈：会什么编程语言，数据处理都是自己用python写的方法吗？有没有使用过什么大型数据处理软件或许使用过哪些python数据分析库？ 5.了不了解结构化数据，大数据？（
大数据
Kubernetes community中已经有了一个Big data SIG，大家可以通过这个SIG了解kubernetes结合大数据的应用。在Swarm、Mesos、kubernetes这三种流行的容器编排调度架构中，Mesos对于大数据应用支持是最好的，spark原生就是运行在mesos上的，当然也可以容器化运行在kubernetes上。当前在kubernetes上运行大数据应用主要是sp
字节跳动金融部门抖音支付业务线大数据开发一面
1、数据仓库分层了解吗，实时离线都怎么做的？ 2、Spark有哪些分区器？ 3、宽窄依赖的定义？发生宽窄依赖转换的时候会发生什么操作？ 4、shuffle操作增加了什么开销？底层用的什么算法？ 5、Spark内存模型有了解过吗？ 6、如何解决数据倾斜问题？ 7、Flink了解吗？checkpoint机制做什么用的？底层怎么实现的？ 8、Spark没有checkpoint机制，那么中间计算结果怎么保
【2023校招】巨杉数据库数据库开发
1101 - 技术面自我介绍实习经历 K8S： K8S 和 Spring Cloud 了解如何基于 K8S 部署服务 K8S 部署服务的流程基于 Spring 开发过的个人项目，是课程吗对巨杉了解算法 1103 - HR 面自我介绍校园经历实习经历 Offer：手头 Offer 及薪资待遇，偏向程度期望薪资相同薪资的 Offer 如何选择个人优势反问 #面经##校招##
阶跃星辰大数据基础架构研发一面
系统组 1.自我介绍 2.实习拷打 3.项目拷打 4.spark任务提交过程 5.sparkrdd运行过程shuffle阶段拆分 6.hdfs上文件存储方式 7.hdfs写数据流程 8.算法：判断链表是否有环 9.反问 23大概40min 4567 10min 8 5min
科大讯飞大数据工程师一面凉经
笔试过了一个月给捞起来了一面 45min 1. 自我介绍 2. 细聊项目，很细（一上来就忘了数据量，尴尬） 3. 特征工程怎么做的 4. iv值的计算方法 5. AUC的计算方法 6. 正反例不平衡对auc有影响吗 7. 知道过拟合吗 8. 逻辑回归怎么解决过拟合问题 9. 写个函数指针 10. pandas库有哪些数据类型 11. 怎么取两个dataframe有差异的部分（忘了具体函数了，讲了
数码大方-研发工程师-面经
面试问题： 1. 从8个外观相同的球里找出质量不相等的球。器材：一个没有砝码的天平；要求：几次称重后肯定能找出来。 2. 在离散的二维平面图形中，面域由三角形组成，用数组存储每个三角形的顶点，如何找出处于边界上的边； 3. 智能指针的作用和原理；
滴滴秋储大数据架构二面面经
面试官全程微笑，体验感极好。上来大佬先来了个礼貌式微笑。然后自我介绍。问了问我的研究方向（多模态）聊了聊大数据相关的技术？如果来大数据部门想做什么？问了一下我做的数据挖掘的比赛？然后30min一道题。二叉树的z字遍历和阻塞队列二选一问了一下时间复杂度和空间复杂度。反问环节：部门培养人的计划是什么？您是做什么的？整体感觉很流畅，体验很好，期待过 ps：滴滴23秋储一共几面？
大华-Android应用开发工程师-面经复盘
时间：10月 2技术面+hr面已OC 一面 20min 自我介绍重点聊聊你专业方面的一些积累、基础知识，项目经历、角色、贡献主要讲安卓说到Intent传Bitmap的问题你用了全局变量是不是得特别关注销毁和管理管理周期（？有点怪）假如说要查询数据库某一天的数据一般我们数据精确到秒/毫秒级别的时间戳这种时间格式怎么进行筛选怎么去比较（说了from_unixtime和dateti
蔚来大模型工具链开发实习面经
base北京望京，有点心动，技术栈主要还是java开发，需要使用向量数据库面试官人很好一面(45min) 之前用过字节的扣子平台吗(当然用过) 之前实习工作的主要内容了解向量数据库吗，我回答完全不了解，他直接发了milvus官网的官方Quick Start指南，让我看几分钟，看完之后问了我向量数据库的基本用法包括如何查询，插入等操作，还有向量数据库索引的概念等(回答的七七八八) 后面直接问
第二十章基于JFinal的大数据框架快速开发
一、安装 Maven Maven是一个项目构建和管理的工具，提供了帮助管理构建、文档、报告、依赖、scms、发布、分发的方法。可以方便的编译代码、进行依赖管理、管理二进制库等等。 Maven的好处在于可以将项目过程规范化、自动化、高效化以及强大的可扩展，利用 Maven自身及其插件还可以获得代码检查报告、单元测试覆盖率、实现持续集成等等。 1. 下载 Maven http://maven.apa
美团软件开发工程师-数据开发方向（美团平台）暑期实习面经
面试内容分为以下几个部分（时长：一小时 5分钟）： 1.自我介绍。 2.出了一道算法题，将二叉树搜索树转换为双向链表，不新建链表结构，链表结构使用树节点的结构，左孩子代表前节点，右孩子代表后继节点。要求是在不新建节点的情况下实现转换。使用中序遍历解答了。 3.做完算法题目之后出了一道 SQL 题，为薪资表格中获奖人员的薪水字段加 10% 的工资，获奖人员由获奖表格可以查询得到。当时有点理解错误了，
开发动态的Inventory数据源
如动态 Inventory 所介绍,ansible可以从一个动态的数据源获取到inventory信息,包含云端数据源怎么写一个自己的数据源? 很简单！我们仅仅需要创建一个在适当参数下,能够返回正确JSON格式数据的脚本或者程序,你可以使用任何语言来实现. 脚本规范当我们在外部使用``–list``参数调用这个脚本时,这个脚本必须返回一个JSON散列/字典,它包含所管理的所有组.每个组的val
1.2.1.11 数据调试&&开发文档
说明：数据上报到平台后，Hubble平台的分析模块大约需要30分钟能查到数据，若该事件是首次发送可能时间会久些。 1.1. 客户端调试 Android sdk v2.1.7.5 以及之后版本 v2.1.7.5 以及之后版本无需配置，默认即开启，建议更新到最新版本。 v2.1.7.5之前版本 v2.1.7.5之前版本已不支持远程调试，本地调试请查看Android sdk开发文档（控制台日志输出）。
# 4.10美的数据开发笔试
题型：10道单项、5道不定项、2道算法、1道SQL，难度还可以单项题 1. 哪个程序通常与NameNode在一个节点启动？Jobtracker 2. HIVE的建表描述，错误的是：STORED AS 指定存储路径正确应该是指定表的格式 3. 维度建模中雪花模型和星型模型的描述不正确的是：星型模型是多个事实表和多个维度表组成正确应该是 1个事实表和多个维度表组成 4. hive中用get_js

首页

31

32

33

34

35

36

37

38

39

尾页

最新发布

💼｜腾讯产品运营实习｜详细面经🔍高德地图产品经理(社招)哈啰产品经理实习面经 python-数据分析岗位-22届考研-华OD面经安克数开

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

javascript - 为什么相同的代码无法正确排列数据？求java/php大佬帮帮忙？epub - 有没有类似语雀这样的笔记管理软件最后可以导出为EPUB格式的？前端 - 如何在抖音H5页面中让安卓手机拉起自带应用商店下载APP？人工智能 - 要运行本地Midjourney只自己用（只自己使用，不给别人服务使用）1张显卡就足够了吗？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Motto Poseidon IDE TaSSL Heraldry Prana csu-thesis circuitikz JavaWeb-Project-Source-Share

文档资料

Symfony2 Cookbook 中文版 NTLM 中文文档 PHP 语言规范 Beautiful Soup 4.4.0 中文文档 Netty 4.x 用户指南