一面 1.SQL table_a dt, city_id, device_id, gmv tips:每个device一天可能有多条记录 (1)求每个城市每天gmv最高的5个device_id (2)求连续三天每个城市每天gmv都在前5的device_id 2.统计题 (1)自变量存在多重共线性,如何通过变量筛选来解决? (2)线性回归的五个基本假设 3.机器学习 (1)DBScan 与 Kmean
通过内推投递简历,最开始是HR小姐姐面试的,问了关于我实习的经历,主要负责哪些工作,看了我的作品,问我有没有关于教育方面的设计经验,感觉还不错,回去让我等消息,第三天又经历了一次群面,3个人一起面试的我,有HR和设计总监还有教研总裁 主要问题记录: 1、以前有做过教育相关的APP吗? 2、你认为QQ和微信,哪一款产品更好? 3、你在做APP的过程中遇到过哪些困难?这些困哪你是怎么解决的? 4、有线
5月底投了海尔的物联网提前批,那时候海投了一批公司,没发现该岗位原来主要做的是嵌入式开发的,估计面试官都不知道怎么问了,草草过了,总时间25分钟。 面试由一个技术面试官和HR组成,问题: 1.自我介绍 2.针对简历提问,包括 (1)获奖经历 (2) 技术,自己学的是python和Java (3)对嵌入式的了解,不太了解,感觉面试官不知道怎么问了 3.HR提问: (1)印象最深的事? (2)最近遇到
#海尔面经# 海尔 物联网软件研发工程师 一面 没有笔试 说是直接面试 自我介绍 两个面试官 一个技术 一个HR小姐姐 介绍java项目 然后问技术 我做的是一个外卖项目 1.用户下单取消如何处理 背后的逻辑 2.微服务有没有用到 3.这个项目有没有上线 多少人用 第一个一脸懵逼 之前只是简单的看视频做项目 压根没考虑过这种问题 第2,3个还想狡辩一下 最后放弃了 然后 redis的数据
[toc] 2022.05 海尔集团 提前批 算法工程师 简历投递 2022.05.27 海尔集团的简历投递,我是直接在官方公众号,走内推投递的,可能因为提前批刚开就直接投递的,所以流程很快,第二天就收到了笔试通知。 测评 2022.05.27 这个部分就是基础的性格测试,100道性格测试题,不限时,官方说的是建议20分钟做完,实测10分钟左右就可以做完,正常做都没问题。 笔试 2022.06.0
上来丢一道概率论题,(三个盒子,每个盒子有2个石头。第一个盒子两个白色, 第二个盒子两个黑色,第三个一黑一百,问:随机取一个盒子,第一次拿一个石头是白色,另外一个是白色概率) 树遍历相关 2个有序数组合并成一个,不能用额外空间,其中一个数组空间足够大。 反问+聊天 ps:反正也没戏,但是面试官人挺好的
大概三月初投的,约的3/31一面,一面之后两到三天约了二面,4/10刚面完,接下来就是漫长的等待了(据说流程要走四到五周)。 由于是去年才刚成立的子公司所以信息真的非常少,自己准备的时候也像是雾里看花,所以发个面经攒人品好了,给后来的兄弟姐妹们点个灯。 一面: 面试时长写的是15分钟左右。有大概五位面试官,其中一人负责主考,一位应该属于纯人事,另外的一些可能是行政或者领导层来站场的。全程都是主考人
#面经分享# #校招2023# #关于秋招我想说# 11月22日投的简历,当天就给我发了面试通知,定于23日11:00面试。该说是效率高呢还是说…… 面试是群面,面试官只有一个人。 面试一共分为两部分:一是一分钟命题演讲,二是无领导小组讨论。 先说一分钟命题演讲吧,面试官随机抽一个题目,然后大家有一分钟的时间读题和构思,时间到之后面试官让大家举手发言,发言时间只有一分钟,到时面试官会喊喊停。不过这
希望不大,问了二面第二轮综合面,主要考察抗压能力,遇到问题会怎么处理,为什么想去深圳等,一定要准备好体现自己有很强的抗压能力的例子。 还有简历上写的东西都要熟悉,有话可讲,好多会被问到。 第二轮聊了一个小时左右,问的挺多,虽然没过但是感觉挺有收获,可以再好好回顾一下以应对后续面试。 总的来说面试蛮顺利的,问的专业问题也都回答出来了,整个面试氛围比较温和,但是还是要严格要求自己,不断进步才行。 今天
本章海量数据的习题 1 有100W个关键字,长度小于等于50字节。用高效的算法找出top10的热词,并对内存的占用不超过1MB。 提示:老题,与caopengcs讨论后,得出具体思路为: 先把100W个关键字hash映射到小文件,根据题意,100W50B = 5010^6B = 50M,而内存只有1M,故干脆搞一个hash函数 % 50,分解成50个小文件; 针对对每个小文件依次运用hashmap
方法介绍 倒排索引是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,常被应用于搜索引擎和关键字查询的问题中。 以英文为例,下面是要被索引的文本: T0 = "it is what it is" T1 = "what is it" T2 = "it is a banana" 我们就能得到下面的反向文件索引: "a": {2} "banana":
方法介绍 多层划分法,本质上还是分而治之的思想,因为元素范围很大,不能利用直接寻址表,所以通过多次划分,逐步确定范围,然后最后在一个可以接受的范围内进行。 问题实例 1、2.5亿个整数中找出不重复的整数的个数,内存空间不足以容纳这2.5亿个整数 分析:有点像鸽巢原理,整数个数为2^32,也就是,我们可以将这2^32个数,划分为2^8个区域(比如用单个文件代表一个区域),然后将数据分离到不同的区域,
分而治之 方法介绍 对于海量数据而言,由于无法一次性装进内存处理,导致我们不得不把海量的数据通过hash映射分割成相应的小块数据,然后再针对各个小块数据通过hash_map进行统计或其它操作。 那什么是hash映射呢?简单来说,就是为了便于计算机在有限的内存中处理big数据,我们通过一种映射散列的方式让数据均匀分布在对应的内存位置(如大数据通过取余的方式映射成小数存放在内存中,或大文件映射成多个小
本章导读 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、数据库、倒排索引、Trie树)来解决;而对于空间问题,可以采取分而治之(哈希映射)的方法,也就是说,把规模大的数据转化为规模小的,从而各个击破。 此外,针对常说的
今天早上刚洗漱完,托舍友的福十点才刚准备出寝室门,突然一个电话打进来,说是海信的想给我进行简短的电话面试,我寻思这种面试会问什么问题随即应允。但没想到会把我问成这样...... 开局问我自己本科和研究生都学了些什么,然后不依不饶的追问我研究生学了什么?接着问我在实习期间做的数仓的底层架构和数仓设计,问从后端到前端的数据流程,问存储介质是什么,接着问数据是怎么流转的一连串问题让我难以招架;之后问我在