我正在用Kafka Streams(V0.10.0.1)编写一个应用程序,并希望用查找数据丰富我正在处理的记录。该数据(带有时间戳的文件)每天(或每天2-3次)写入HDFS目录。 如何将其加载到应用程序中并连接到实际的? 当一个新文件到达HDFS时,从那里重新读取数据的最佳实践是什么? 或者切换到并将RDBMS表内容写入一个Kafka主题更好,该主题可以被所有Kafka Streams应用程序实例
网易梦幻端游UI外包 一面: 基础: 什么是数据结构?线性与非线性的区别?哪些数据结构属于线性?哪些是非线性? 队列和堆栈有什么不同?(访问元素有什么顺序?) 折半查找是什么? 什么是链表?什么是数组?以及他们的区别 递归跟迭代的区别? 广度优先搜索和深度优先搜索的区别? 树遍历有几种顺序?以及访问的顺序(根节点、左子树、右子树的顺序) 链表的倒置有几种方法? 面向过程编程和面向对象编程有什么区别
bg:25本科,两段实习总计约九个月,实习没打杂。秋招面试共23场,通过22场,挂了1场,预计陆续放出经验总结,各位权当随便看看,我面试场次也没那么多,属于个人经验。 网上八股推荐(针对Java仔):小林coding,javaguide 项目推荐:手写spring 书籍推荐:《计算机网络:自顶向下方法》,《设计模式》,《深入理解java虚拟机》 八股又要多又要精,没办法现在招聘市场就是这样。只是硬
一位面试官,大概40分钟,只有一面 1.确认实习时间,什么时候开始实习,能做多长时间 2.自我介绍 3.面试官介绍了他们的四个方向 4.介绍项目,具体怎么做的包括了数据预处理,模型等 5.不用内置函数怎么算根号二,比如保留小数点后16位,想了半天,说了两种方法,说完第一种方法后面试官问还有没有其他的方法,说了第二种方法后面试官问还有没有其他的方法,没回答上来 6.田字格或九宫格从左上角到右上角不走
手写一段sql语句,具体内容忘了,好像和limit有关 存储引擎的区别 InnoDB: 支持事务,是面向在线事务处理(OLTP)的应用,特点是行锁设计,支持外键,并支持一致性非锁定读,即默认情况下读取操作不会产生锁.是默认的存储引擎:.还提供了插入缓冲,二次写,自适应哈希索引,预读等高性能和高可用的功能. MyISAM: 不支持事务,是表锁设计和支持全文索引,主要面向一些OLAP的数据库应用.它的
笔试: 投递后很快就收到了hr的回复,发了一个word文档作为笔试题,24h内完成,不是很难 几道SQL题(窗口函数),一道业务题(给了一个生活场景,问你的分析思路,我写了swot分析),几道python题(关于数据处理和数据整理,主要考点是pandas) 一面20min: 1.自我介绍 2.在上一段实习中选一个能体现分析能力的项目的介绍,挖得很深,问了很多方法上的细节和原因 3.抖音和快手的区别
可以提前准备好答案,也就那么几题,录制视频后会转成文字,可编辑文字。 一个小时,四题,每题限时6min。 1、分享一段你达成挑战性目标的经历。当时你的目标是什么?挑战在哪里?过程中你做了哪些关键行动最终保证了目标的实现 2、请分享一段你学习新知识和技能并运用于生活或工作的经历。你为什么要学习这个知识技能?过程中遇到哪些困难?你做了什么来掌握?最终如何在实践中应用的? 3、请分享一段通过你的沟通协调
一面: 8.26--HR面 1.自我介绍 2.特别的经历 3.专业方向 4.做过的项目 5.薪资期待 6.公司的简单介绍,问有些情况是否能接受 二面:9.14--技术面 1.关于大数据技术的认识 2.对Hadoop和Spark的了解 3.对其区别的认识 4.对hadoop特定函数的认识 5.介绍自己了解的窗口函数 6.介绍一个算法,比如支持向量机 7.对自己做过的社会实践的感受 8.反问 三面:9
1自我介绍 2.项目中数据量 3.用户分析维度 4.客户流失分析模型指标 5.oracle和hadoop的了解 等了一个多小时,这就是国内甲方和卑微求职乙方吗?要不是面试官是个声音好听的女生,我大概会骂人吧。 岗位和个人经历不算匹配,我个人经历更偏向数据挖掘,感觉这个岗位更偏向业务分析和数据库。 最后还是再感叹一下,虽然今年秋招求职者的确处于弱势地位,但也不是说招聘单位可以不尊重人吧,起码自己定的
这是我面过时间最长的面试 1h20min 技术面+hr面 2个数据部门的主管+1个hr 技术面 第一个主管主要疯狂轰炸关于机器学习基础知识, 包括各个基本模型的流程,比如SVM,LR,聚类算法等 以及深度学习的一些模型知识CV这些,还想问我NLP,但我说我们接触过 总之能问的都给你问一遍。 然后深挖简历上关于数据建模的项目,问的很细很细 平常了解数据科学领域的前沿知识用什么公众号之类的 第二个技术
字节数据分析实习面试(抖音电商) 一面: 表user_log,有user_id, time,求每天用户新增数,次日留存率、30日留存率 ABTest的流程,P值,做留存率的ABTest,选择什么检验,卡方检验的应用场景 逻辑回归的损失函数 出现过拟合的原因 三天后给了感谢信 快手数据分析师(短视频用户增长部门) 一面: 两个SQL题目,都还比较简单,主要涉及到group by和日期函数的处理,还有
真的很想攒攒人品,开始准备投简历面试后发现,自己的简历基本可以过,面试也收到一些,但是到二面真的好难,写一下总结,也希望之后的面试能顺顺利利吧 一:深信服(日常实习) Boss投递,效率非常快,怀疑被KPI了 一面3.6: 1.自我介绍简历深挖,挖得非常非常深,我说的每一句话之后都是给自己挖的坑: 实习主要负责什么, 怎么分析异常, 各项指标的构成以及为什么会被当做关键性指标,其他指标为什么不行
1.问了我项目的问题,spark整合kafka这阶段做了什么事? 答:jdbc工具类向mysql表中插入数据,产生binlog日志文件,maxwell捕获到,kafka进行消费,然后javaapi上面编写kafka工具类,获取主题,编写配置信息,get到消费的内容,是JSON格式,转换json格式为row,然后转换为dataframe表,使用sparksql处理。 2.kafka的acks值有了解
会根据简历问问题,开头两道算法题,直接人傻了。 第一道题比较版本号,一上来数组方法split忘了,问的面试官。不过小哥人很好,直接告诉我了,还给我拼了出来s-p-l-i-t 。。。 第二道时字符串相加,一开始是相乘,后来说时间太久了,就变成了相加,不过写了一半,我太磨蹭了(太菜了)。小哥说说一下思路,就开始问八股了。 然后就开始看简历写了啥问我vue-router的两种模式,问我底层原理(不会 问
#你都收到了哪些公司的感谢信?# #晒一晒我的offer# #数据人的面试交流地# #数据人offer决赛圈怎么选# #数据分析#