一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
大数据面临数据规模大、数据变化快、数据类型多、价值密度低4个挑战,而传统的数据可视化工具难以应对。传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、
名称: txt_to_pika 位置: /pika-tools/txt_to_pika 目的: 将txt文本的kv数据写入pika 使用: Usage: ./txt_to_pika txt pika_ip pika_port -n [thread_num] -t [ttl] -p [password] example: ./txt_to_pika data.txt 127.0.0.1 9921 -
说明 pika新版binlog有时间戳,开发binlog_sender工具,根据输入的时间段回放对应数据到某个pika实例 工具目录: pika/tools/binlog_tools/binlog_sender 使用参数: -h -- 显示帮助 -t -- l 显示日志类型,old 或new -i -- pika实例的ip -p -- pika实例的port -n -- 输入的binlog的路径
pre { white-space: pre-wrap; } 本实例演示如何添加工具栏(toolbar)到数据网格(datagrid)。 创建数据网格(DataGrid) <table id="tt" url="data/datagrid_data.json" title="DataGrid with Toolbar" iconCls="i
9.11 一面 35min: 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
1.自我介绍 2.实习项目拷打 3.场景题,有一万条数据,但有一个类只有条数据,训练时要注意什么,我:构造数据;增加查全率。面试官:从模型方面讲讲。我:加入正则化项。面试官:损失函数的权重。 4.一个项目,反例比较少,选择一个模型评估方法。没答上来。面试官说AUC曲线,让我说说原因。也猜到了要答AUC曲线跟数量无关,但是有点印像,画曲线的时候是要使用正例反例数量的,不敢说话,疯狂道歉。 5.SQL
面试问题: 1. 从8个外观相同的球里找出质量不相等的球。器材:一个没有砝码的天平;要求:几次称重后肯定能找出来。 2. 在离散的二维平面图形中,面域由三角形组成,用数组存储每个三角形的顶点,如何找出处于边界上的边; 3. 智能指针的作用和原理;
我记得我没有投递过这个部门,但是约的面试是数据开发部门。 面试官很好,是我这两周最好的面试官了。 1.自我介绍 2.实习具体工作 3.觉得实习工作有哪些价值 4.自己认为自己有哪些比别人强的优势 5.http/https区别,端口是否可修改 6.get/post区别 7.mysql为什么使用b+树索引 8.秋招目标 反问。 面试官直接告诉我 京东基本没有C++技术栈,90%是java 所以感觉大概
本来我以为一面可能是专业面,但是其实是信息了解,最开始电脑出了一些故障,换成手机,所以面试前一定检查设备,hr打电话好慌张 面试时间七分钟左右 首先就是自我介绍,网上有很多模板,可以参考 对网络安全的认识,这个我真的没想到,有点慌张,就根据之前参加网安宣讲会的来说 一些常见的攻击手段,我很紧张当时,攻击手段和漏洞都说了 有没有参加过攻防比赛,这个我真的还没有参加,我就看了书,就如实说了 对攻防的认
人生处女面献给了腾讯, 惨败...... 把人家面试官都搞无语了....就很离谱 流程大概就是 1.自我介绍 2.项目 3.PCA 4.数据库事务特性 5.大数据平台hadoop,hive 6.操作系统线程进程区别 7.手撕两个栈实现队列 ....... 啥也不是,还差好远好远 开始怀疑是不是要走技术这条路了 差点泪洒当场 吓得我赶紧说再见
走的社招,23届软件开发,有差不多两年Java 后端开发工作经验,投递的测开岗位。 一面,二面相关内容,不写太详细了: 多线程方面知识:实现多线程的几种方式,线程池原理等,使用场景,线程通信,JMM模型,ThreadLocal原理等,项目中那些地方用到,满了怎么处理;乐观锁,悲观锁等 Redis等相关知识:Redis锁,使用场景等问题,项目中那些地方用过;分布式锁等; 垃圾回收:哪几种清理算法,模
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
火车票业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、聊实习,扣细节 3、聊实习项目技术难点,聊到了我用later view遇到的坑,面试官直接激动,并表示他前几天也碰到了这个坑,两边都很惊喜,直接惺惺相惜 4、聊竞赛经历,内容以及遇到的难点 5、开始八股,写吐了,这里就省略了,要看的看我之前的帖子 6、sql题,是啥忘了,难度中等吧 7、反问 二面 主管面: 1、自我介绍 2、
问题内容: 我试图找出一个查询,该查询显示在多个部门中工作的员工 人数 (数量)。这里的表名和字段: (id_employee,employee_name,薪水) (id_dept,dept_name,预算) (id_employee,id_dept,workhours_percentage) 假设Department_Employee表的内容是 进行正确的查询后,结果应为2(员工),因为有2个员