2023校招齐鲁空天院大数据开发一面凉经

优质

小牛编辑

367浏览

2023-03-28

写这篇帖子是记录我的面试经历，因为不是什么大佬，所以求职过程坎坷是免不了的。毕竟大家都在竞争，择优录用嘛

6月14日投的简历，23号就联系面试了。一直以为7月份后才会有面试安排，不过这进度还算是挺高效的了，点赞，另外面试过程中面试官态度都很不错，点赞。

首先面试的内容与自我介绍和简历上的内容关系很大。因为每个人会的技术栈是不太相同的，另外像空天院或者是其他科研院所等国企单位对于学校内的经历以及科研课题（针对硕士吧）比较关注，建议多准备一下。

下面是我在面试过程中的问题的总结，有一些太过简单的就不列举了，所以列举的还算是其中不太简单的题目。

1. 自我介绍

上来就是自我介绍，也算是进入面试状态的热身吧。

2.介绍实习经历

因为我有一段实习经历，虽然也没啥可说的，但是写在简历上了。面试官为了找切入点也就问了。我的那份实习主要是数据仓库相关的吧，对数据抽取后分层存储，然后用sql计算数据指标。

（1）主要做了什么工作：

数据仓库、抽取数据进行存储、将数据进行过滤

（2）数据库间数据迁移是用什么方式进行的：

采取一些工具，集成到了平台上

（3）用到的数据库是什么

ORCALE

上面这段实习和大数据不太相关，属实减分项了，后期改改实习内容，不能再自己挖这么大的坑了。

3. 编程语言

问到了常用的编程语言，我说对于java比较熟悉，所以接下来问了下java语言的内容。另外我也有提到学过python，scala 可到

（1）常见的set集合有哪些，HashSet是怎么实现的？

答：常见的set 有HashSet 和TreeSet

HashSet的实现原理：HashSet 底层是用到HashMap实现的，其中HashSet的值对应到HashMap中的Key，而Value是Null来进行填充的

（2）HashMap的底层实现原理

答：HashMap由数组 + 链表 + 红黑树。（适当扩展详细点）

（3）快速排序的实现原理，时间复杂度是多少，为什么是O（n log n）

答：快速排序实现的重点在于数组的拆分，通常我们将数组的第一个元素定义为比较元素，然后将数组中小于比较元素的数放到左边，将大于比较元素的放到右边。

快速排序最好的情况下时间复杂度为O(N log N) ,最坏的情况下时间复杂度为O（n2），平均时间复杂度为O（nlogn）。

最优的情况：快速排序本质上以一个拆分的算法，在最优的情况下每拆分一个数组，这个数组是有序的，那么算法的复杂度和递归的时间复杂度是一样的，另外，一个数组拆成两个子数组

最差的情况：最差的情况是每拆分成的数组都是反着的，所以都要进行交换。

（4）scala 中val 和var

答：var 定义的是可变类型的变量，可以重复赋值

val 定义的是不可变类型的变量，不可以重复赋值

（5）python 中list 和tuple 介绍

答： list 可变列表

tuple ：不可变，初始化之后变量不可变

（6）python深复制和浅复制

答：浅复制，复制的是变量的引用

深复制，创建一个新的内存空间，完全复制变量的内容

4.大数据

因为我的简历上没有写项目，面试官说我缺少项目经验。当然我当时也承认确实缺少时间、是自己利用课余时间学习的。所以简单问了一下，这方面我回答的不好

（1）spark 中 RDD、DataFrame 介绍

答：RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。

DataFrame：在Spark中，DataFrame是一种以RDD为基础的分布式数据集，类似于传统数据库中的二维表格。

（2）Hive的存储格式有哪些介绍一下？

TextFile
SequenceFile
列式存储
RCFile
ORC
parquet
AVRO

5.智力题

（1）一张A4 纸上随便画一个图形，如何求面积？

6.编程题

不需要写代码，需要口述思路

（1）比较两个版本号的大小

力扣上有类似题目

#23秋招##空天院齐鲁研究院##大数据开发##凉经#

2023校招齐鲁空天院大数据开发一面凉经

热门公司

相关阅读

推荐文章

推荐题库

推荐问答