7.22一面 spark的底层原理 spark yarn client和yarn cluster的区别 dataframe如何创建 数仓项目中用了几个节点,各个组件如何部署的 HA介绍一下 数仓分层介绍 hadoop的一些命令 hadoop如何更改文件所有者 kafka的监控 linux命令,vim编译器的命令 集群间节点是如何通信的 core-site文件一般配置什么内容 ranger权限管理的
有人知道京东数据分析笔试考啥吗,我看邮件里说无编程题,难不成考数据库? 更新一下: 笔试是50道行测,整体比较简单,当然不知道是不是因为我复习过行测的原因 5道资料分析非常简单的 大约10道的数字推理题,比如1 2 5 10 17 下一个数字是啥,有几个是比较难的 再就是言语理解和图形题 #京东笔试#
题型:20道选择题,3道编程题,其中第一题写SQL 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 选择题: 下列排序中需要额外辅助空间的期望值最大的是() 堆排序 希尔排序 快速排序 冒泡排序 双十一快到了,某服装厂为了赶制订单,加班加点使用设备生产衣服。如果某一设备在时间长度为的时间内发生故隙的次数服从分布N(t)~P(λt) (H松分布),求该设备在无故障工作8小时后再次
# 一面 9.18 自我介绍 实习工作用的什么计算架构、开发节点怎么调度的、数据量多大、每天跑多久 介绍spark shuffle 阿里用的olap数据库是什么 阿里的onedata建模规范 了解clickhouse吗 可以接受来实习吗 你对自己的规划是什么 (到这里只有十几分钟,问我有什么想问的) 开始反问 # 二面 9.19 自我介绍 介绍Hadoop 介绍spark任务执行流程 Spark几
二面说是30分钟,但实际要面45分钟,希望能过 1. 自我介绍 2. 看你写了对数据结构和算法比较了解,说一下 回答的链表 树和图,还有常用的堆 红黑树 LRU 跳表 3. 那你比较一下红黑树和跳表的优缺点 4. 哈希表了解多少 回答的C++中的map unordered_map 比较一下他们的区别,原理 空间复杂度 5. B+树了解吗,为什么MySQL中使用的是B+树而不是红黑树 跳表 6. 写
为啥官网上写着java 数据库,结果面试全问我C++,这几天看的数据库都没问啥 30min 1. 自我介绍 2. 说一下Linux和常用命令,线程和进程的区别 线程和进程的本质区别是什么 3. Linux如何查看是哪一个进程占用率指定端口 4. C++了解到什么程度 5. C++中的const和底层const 的区别 fun(int i) fun(const int i)有什么区别,编译器怎么看
#软件开发笔面经# 1、自我介绍 2、面试官:你倾向于数仓还是数开。我:实习做的数仓,所以更倾向于数仓。面试官:好的,我们是做后端开发相关的 3、说一下实习期间做的工作 4、介绍下你的第一个项目 5、了解过zookeeper吗 6、spark中dataframe和dataset的区别 7、简单说一下kafka是干什么的,消息能保证全局有序吗 8、了解容器吗,docker和kubernetes 9、
问题内容: 我认为你不能将Java泛型类型参数绑定到下限(即使用关键字)。我正在阅读Angelika Langer泛型常见问题解答对此主题的看法。他们说,这基本上可以归结为无用的下限(“没有任何意义”)。 我不相信。我可以想象它们的用途是帮助你更灵活地调用产生类型化结果的库方法的调用者。想象一下一个方法,该方法创建了用户指定大小的数组列表,并用空字符串填充了该列表。一个简单的声明是 但这不必要地限
我试图在一个没有权限在WildFly主目录和子目录中写入的用户下启动WildFly 8.2。为此,我已经将目录复制到用户主目录。下面是我用来在cygwin中启动WildFly的命令: 这是这个命令的输出: 正如您在上面的日志中看到的,首先WildFly尝试写入,即使命令行中指出了另一个目录作为服务器基本目录。由于缺乏权限而无法在那里写入WildFly继续正常启动服务器。 有没有办法让WildFly
我是CNN和Tensorflow的初学者。我试图用自己的数据在tensorflow中实现卷积神经网络进行预测,但我遇到了一些问题。我将Deep MNIST for Experts教程转换为此。对于专家来说,深度分类是一种分类,但我正在尝试回归。另一个问题是,该代码为每一步提供的精度为1。错误的原因是什么?如何将此代码转换为回归? 数据集: 代码: 输出: 我对神经网络和机器学习很陌生,所以请原谅我
我已经创建了一个谷歌表单。在单个google工作表中有多个工作表(选项卡)。 我有一张名为 还有其他一些表单,如,。除仪表板外,目前还有2张其他图纸。所有两张图纸都有相同的列 我想在工作表上执行一些计算。 计算总任务数 注意:我上面的公式工作得很好,但我将有20张而不是2张。所以我的计算公式是 etc 每次有新的表格出现时,我所有的公式都会很长。 有什么简单的方法可以在谷歌表格中进行计算吗? 我们
9.16 一面 20min左右 1.自我介绍 2.挖实习,针对部分细节做提问 3.数据分析需要哪些技能 4.反问 9.19 二面 25min 1.自我介绍 2.深挖简历,面试官比较关注项目的产出 3.广告投放的渠道分析(实习中有) 4.是否了解地产数字化 5.反问 问了下后续面试流程,说是至少还有一轮业务面+hr面,如果sp的话还会有总监面 许愿终试 龙湖数科数据分析求抱团 #龙湖集团数字科技##
联通数科-数据开发 三四个面试官挨个提问 1.自我介绍 2.针对简历问了项目和实习 3.一个简单的sql题 口述 表中有id不重复和邮箱重复 找出重复邮箱… 愣了一下 因为题目说的很简短没有其他要求 然后就回答 对邮箱groupby count一下 面试官说没问题 4.询问使用过的数据库 (不大记得原话是啥,细问了一下是说olap存储引擎吗? 面试官说是 像ck、hbase、doris)回答:使用
暑期实习(投得算是比较早),来和大家分享一下面经~😀 流程:顺丰流程个人感觉挺高效,体验也非常不错。 投递完之后就测评 4-15 显示简历通过安排面试 4-24 一面结束 代码是手写单例模式 4-25 二面结束 HR面 4-29 邮件offer (以下面试问题不是按照时间顺序,是按照个人回忆的顺序😅😅)我的技术栈是Spark方面的。 1.自我介绍,详细介绍一个个人的关于分布式系统开发的项目
本人大四研0。感觉这次面试是本人经历的面试以来最有难度的一次,Mobvista看网上风评很好,希望疫情赶紧好起来,我想去实习了。 11.02 一面(1h) 1.自我介绍 2.项目介绍 3.货拉拉实习工作 4.docker镜像分层以及核心原理 5.HBase预分区、rowkey设计原则 6.是否了解spark on k8s,说的不太懂k8s 7.描述下spark on yarn的任务调度流程(clu