我是学数学的2024应届,本科阶段有选过大数据的专业选修课,但是编程语言真的不太会,跟科班出身的计院同学没法比,今年数分岗又卷到爆炸,双选会问了几个公司都说数分岗爆满(快手中移信息技术中心),只好一并找找其他方向,上周笔试以为铁挂了就没怎么准备,结果昨天晚上22点发今天的一面邀,一个晚上加上午恶补大数据知识。面试官非常和蔼: 问项目: 大数据技术实验做了什么东西?是为了实现什么?(本科课程里的实验
美团一面3.20 1、聊项目 对我研究生的课题很感兴趣,让我展开讲一讲 2、说说对数据湖的看法,企业里应用数据湖还处于探索阶段,问我觉得这是什么原因 3、hadoop的架构原理是什么呢?有哪几个部分组成 4、hadoop是如何去读取和写入一个文件的 5、HDFS存储文件,是怎么进行存储的? 6、假如我有一个千兆的文件,那是怎么上传到HDFS上呢?具体是什么一个过程? 7、Hadoop默认副本是几个
选择题考的408不多,主要是HDFS、Spark、Python语法、Linux 编程题: 1.字符串,过于简单就不写了 2.三素数之和,给你一个正整数N,你需要选出3个小于N的素数A、B、C,来满足A+B=C²,输出所有可能的结果数 我的想法是狂用标记数组,差五分钟就写出最后一步了 3.SQL编程,主要考察窗口函数排名函数、窗口内分区排序,流程控制函数
岗位JD 使用大数据组件对海量数据进行建模,参与数据仓库的的开发、维护及优化 岗位要求 计算机相关专业,对大数据有浓烈的兴趣 扎实的计算机基础,熟练使用python/java/scala其中至少一种语言 熟悉Hadoop生态体系,包括但不限于Hadoop/Hive/Spark/Clickhouse 学习能力强,强烈的责任心,具有较强的沟通能力及团队合作精神,细致耐心、积极主动 有大规模数据/日志处
一面:30min 自我介绍 实习和项目内容 数仓常问的分层、维度建模等 八股,基本是按照简历问的 Spark和MR区别和优劣? Spark的Shuffle和MR的Shuffle的区别? Standalone模式是怎么调度资源的,Yarn模式有什么变化? Kafka消息投递保证机制?有出过问题吗?怎么解决? 介绍一下HBase?优缺点?使用场景? LSM数和B+树区别? SQL题: 同时在线最多人数
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
在这炎热的夏天让我心底来个透心凉吧 找实习的时间太晚了所以心中很焦虑,结果就这样华丽丽的葬送了机会啊。面试官还是挺好的,问的问题基本都是数据开发的必考题目,首先是spark的shuffle机制(没答上来,这也是整个面试崩盘的开始)下面是从网络上找到的答案:前一个stage 的 ShuffleMapTask 进行 shuffle write, 把数据存储在 blockManager 上面, 并且把数
15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
面经:主要看学历40%、项目经历30%、籍贯30%,一共17分钟 1.自我介绍 2.负责项目和擅长的编程语言(注意:项目大小由面试官判断) 3.hdfs流程 4.编程语言八股(好笑的是说python面试官都蒙,说Java才能走流程 5.项目追问 遇到问题: 1.非硕不要报,就是刷kpi的,海外本科可以报下,有点恶心; 2.非当地省份户籍的慎重,否则同样kpi,面试官比较看重这一点,对外地很会阴阳怪
我尝试实现Spring Batch。在这里,我试图将数据从文本文件保存到数据库中。我在处理的时候得到了NPE。 在这里,我使用JPARepository将文本文件数据保存到自定义writer类中的数据库中。此处StudentRepo为空。 为什么是空的?我尝试了另一种方法,用同样的方法手工存储在数据库中,没有问题。只有在writer类中,它是空的。
我无法将数据从postman发布到我正在使用的mysql数据库express 我尝试过使用Body和Raw x-www-form-urlencoded 这是我的代码(是的,所有内容都在同一个文件中,我知道这不是一件好事,我很抱歉) 这是我在邮递员和数据库中的截图错误
问题内容: 反正是有创建的Redis数据库,在那里密钥 必须 在一定时间后会过期吗?我知道我可以使用命令来使单个密钥失效,但是由于无论如何我都会在一定时间后使每个密钥失效,因此最好在Redis配置文件中指定此行为。 问题答案: 不可以,Redis(v3.2及更高版本)不提供自动设置新创建键的TTL的方法。您必须为创建的每个键显式设置它。
问题内容: 从Actor中读取的文件:Zac Efron 传记:他出生于加利福尼亚州的圣路易斯·奥比斯波,并在阿罗约·格兰德附近长大。在几集《夏姆兰》(2004)的客串中,他以女孩疯狂的卡梅隆·贝尔的身份参加常规演出。埃夫隆还出演过许多飞行员,例如卡尔·兰克(Carl Laemke)的《大世界》(2003)(电视)和三重播放(2004)(TV)。 More_Bio:Efron于2006年6月毕业于