1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
信息爆炸这个词,想必对于大家来说,已经没有多少新鲜感了,而信息爆炸所引发的大数据,却日益成为了企业的宠儿,越来越多的企业也逐步认识到了大数据的重要性,但是大部分企业往往只看表面,盲目跟风,大量收集数据,有用的无用的,企业的行业的,生怕没有抓住大数据的风口导致自己的落后,上马各种信息化项目,结果往往导致企业虽然存有大量数据,但却发挥不出数据应有的作用,甚至形成一个个的信息孤岛,非但不能成为助力企业发
字节商业化技术大数据一面45min 自我介绍; 介绍熟悉的项目,说了数仓项目,重点问了分层中的DWB层数据降维;DWS层中的事实表; MR流程; spark为什么比mr块; sparksql执行流程; 缓慢变化维; sql部分最高薪资员工; sql用户最高连胜次数; 实习时间; 是否准备秋招??? 反问
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
面试时间:1h 10min 自我介绍 实习工作的一些问题 项目相关的一些问题 Java基本数据类型? String为什么不是基本数据类型?能不能继承? 如果需要频繁地拼接字符串用什么?为什么? StringBuffer、StringBuilder 的区别? Java的集合类了解吗?都有那些?它们的继承关系是怎么的? 讲讲HashMap? HashMap多线程下怎么办?多线程的HashMap它的原理
面经:主要看学历40%、项目经历30%、籍贯30%,一共17分钟 1.自我介绍 2.负责项目和擅长的编程语言(注意:项目大小由面试官判断) 3.hdfs流程 4.编程语言八股(好笑的是说python面试官都蒙,说Java才能走流程 5.项目追问 遇到问题: 1.非硕不要报,就是刷kpi的,海外本科可以报下,有点恶心; 2.非当地省份户籍的慎重,否则同样kpi,面试官比较看重这一点,对外地很会阴阳怪
40道选择题,涉及Hadoop、Kafka、MySQL、数据结构、数学(高中水平)、Linux,里面两道Linux选择题真恶心,给了一堆Shell脚本,看不懂
一面: 感觉一上来就是主管面,主业务面,考验业务能力和沟通能力 介绍下专业的课程,说说最喜欢哪一门,为什么 直接问实习经历 实习中的项目,扣细节(大部分时间都在问这个) 在同程做了什么业务 广告业务数仓负责哪些东西 广告投放的指标,如曝光、转化等等 广告有哪些类型 聊聊广告投放流程,投前、投中、投后 投中的过程每一轮具体的事情 对比hive和spark 为什么业界都用spark不用mr了 聊聊fl
当前的问题:我们目前正试图从数据库中获取超过500k(五十万)条记录,然后我必须在JSP上显示每页50条记录(使用struts 2)。问题是加载需要很长时间,甚至有时不需要。一旦装载完毕,我们就能顺利航行。 需要的解决方案:喜欢按照分页定义的记录加载有限的记录,例如:每页最多加载100条记录。有人在struts或类似的框架中实现过类似的功能吗?我也不想一次得到所有的记录。请指导我如何实施?
我们有一个API来处理来自不同来源的数据(数据库、webservices、纯文本、...)所以我们将它存储在列表结构中。我们有这段代码来选择它们中的一些列,并应用函数来获取新数据(如和两列,...) 在上面的代码中:LeftDataquery是一个获取列表的类,其中的数据执行此操作,并返回 LeftFuncions是从源数据创建新数据的公式,“lefdataquery[1]+lefdataquer
本文向大家介绍PHP函数分享之curl方式取得数据、模拟登陆、POST数据,包括了PHP函数分享之curl方式取得数据、模拟登陆、POST数据的使用技巧和注意事项,需要的朋友参考一下 废话不多说直接上代码
使用指南 - 疑难问题 - 数据矛盾问题 - 趋势分析、受访页面、地域分布等分报告中uv数据不一致 每个报告的分析维度不同,因此去重逻辑不同。 1)网站概况、趋势报告是以整个站点为维度去重的,用以了解站点整体流量和访问量。同一个访客一天内多次访问网站只记录一次。 2) 受访页面报告是以页面为单位,UV、IP等数据以页面为维度去重。 3)全部来源报告分了3个维度:搜索引擎、直接访问、外部链接,以来源
问题内容: 我在具有18条记录的数组数据的jqgrid中遇到分页问题,但是即使我指定了pagination:true,pager:jQuery(’#pager1’),记录也不会显示在页面中。您能帮我实现分页而不是滚动吗? 问题答案: 您的主要问题是添加大量行后应重置。线 在代码末尾将解决此问题。我建议您添加行 直接在定义jqGrid之后。然后,您不仅将具有数据分页,还具有数据过滤(搜索)和刷新