大数据开发暑期实习总结 这篇文章总结了美团近30篇面经的题目,想着大家可能也需要答案,于是我根据自己的理解以及网上的一些答案进行了梳理,如果有不对的地方,大家可以评论区留言讨论哦(别喷我~~~) Java 写一个多线程代码 class RunnableDemo implements Runnable { private String threadName; public Runn
数据库 索引,B+Tree MySQL架构。Server层、存储引擎层分别干啥? 一条查询语句执行流程? 一条update语句执行流程? 两阶段提交? redo log、binlog 分别保存在哪一层?什么位置?(不会) 事务隔离级别? with nolock 在哪个隔离级别?(不会) 复盘 问的都是数据库的一些东西。一面过,二面不面了
自我介绍 什么是数据仓库,和数据库有什么区别? 数仓是怎么构建的?(然后开始细抠项目的内容,可怕) Hive的存储格式有哪些? 实习做了什么工作?有哪些难点?为什么离职?(寒冬哪有我的位置?) Spark和Flink的区别是什么?(简单说了一两点,感觉不是面试官要的答案) Spark Streaming接收Kafka数据的两种方式?(这题真不会) 都学过哪些专业课程? 结束 整个流程挺快的,会就是
1. hadoop如何实习高可用 2. 实习的需求(异步io) 3. 进程和线程的区别,通信方式有何不同,在开发过程中,需要注意的地方? 4. 物理地址空间和逻辑地址空间 5. 两道算法题,一道二分,另一道是改进之后的二分
1.自我介绍 2.项目 3.实习优化工作 4.强化学习原理 5.sql和java/python的区别 6.写题 统计每个年级,最高分数学生 7.numpy\pandas有没有一种可变机制的修改(没听过,真没听过) 8.对于RDD不可变的理解 9.对谓词和谓词下推的理解
思特奇一面 19min(已进终面)总体来说不难,但是网上风评不太好 1. 自我介绍 2. 介绍一下你在实习中用到最多,掌握最好的技术? 3. 介绍一下你项目中,从数据采集,到数据加工到标签生成,整个流程能介绍一下吗? 4. 标签用什么语言开发?能简单介绍一下hive吗?hive的分区?hive表能单条删数据吗? 5. 你能说一下hive sql的性能优化吗?参数+代码 6. 说一下你的比赛内容?你
项目,根据项目问一些八股 略 记录没答好的 mapreduce的shuffle算法有哪些? mapreduce说的时候忘记切片过程了,导致后面问map分区数懵了,这都能忘废了 雪花和星型模型的区别,我只答了join和冗余,没答全
研究生学的机器学习,结果今年算法岗全军覆没,倒是开发岗被捞了。由于是三个多月之前的面试,有些问题记不清了,特此抱歉。 23.11.30 一面 自我介绍 JVM的组成,垃圾回收机制 MapReduce的流程,Spark与Hadoop的优劣 快速排序的原理,是否是稳定的(估计是前面答得不太熟,太久都忘了) BEV的原理和流程(简历项目) 笔试第一题的思路 手撕(只记得是一道滑动窗口的题,用两层for就
1.问实习问项目问成绩 2.机器学习算法了解哪些,分类算法?特征工程? 3.kafka原理,spark优势 反问:业务技术有哪些—离线实时都有,和国外电商有关 总结:时间较短二十分钟,比较轻松,不知道有没有二面
24届秋招 一面电话面 自我介绍 介绍实习工作 数据倾斜怎么解决 map join 原理 维度缓慢变化了解吗 二面视频面 介绍实习 实习工作具体内容 口述SQL题 了解哪些数据治理 数据仓库迁移介绍下 过了几天HR面 OC
腾讯会议一面(30分钟) 自我介绍 项目介绍 数据如何采集,整个流程叙述一遍 项目难点说一下 两个项目的区别讲一下 数仓分层里面的表叙述一下有什么 分析一下两个事物之间的关系,怎么分析(有点抽象的问题),有什么经验
👥 面试题目 hadoop的三个核心组件,以及hdfs的读写原理 hive的内部表与外部表有什么区别 hive里面的数据倾斜是什么?怎么去处理?该怎么去预防? 数据仓库的分为几层?每一层是做什么的?是根据什么进行分层的? hive里面的窗口函数有没有用过?rank(),,dense_rank(),row_number()这三个有什么区别? hive里面数据表合并是怎么合并的? hive里面的列
本章介绍如何从OrientDB命令行断开与特定数据库的连接。 它关闭了当前打开的数据库。 以下语句是Disconnect命令的基本语法。 注 - 只有在连接到特定数据库后才能使用此命令,并且只会关闭当前运行的数据库。 示例 在这个例子中,我们将使用在前一章中创建的名为的数据库。 我们将从数据库断开连接。 可以使用以下命令断开数据库连接。 如果它成功断开连接,将获得以下输出 -
我有一组SQL Server批处理过程,所有这些过程都需要安装并定期执行,它们都具有以下结构: 使用 如果存在(SELECT*Fromsys.objectsWHEREobject_id=OBJECT_ID(N")AND type in(N'P', N'PC'))DROP PROCEDURE[dbo].[]GO 创建过程 作为 开始 结束 我正在寻找一种方法来运行每个.sql文件一次,以便在所有数据
问题内容: 我基本上想采用由php应用程序(codeigniter框架)创建和使用的现有mysql数据库结构,并将其反向工程为django应用程序。有一些工具可以做到这一点吗?南迁徙也许? 问题答案: 创建一个项目,然后将设置指向@数据库 然后跑 这将为您指向的数据库打印出python模型文件 您可以通过执行以下操作将其输出到文件中 然后,您可以将文件移动到最合适的位置,并根据需要进行编辑。