本章海量数据的习题 1 有100W个关键字,长度小于等于50字节。用高效的算法找出top10的热词,并对内存的占用不超过1MB。 提示:老题,与caopengcs讨论后,得出具体思路为: 先把100W个关键字hash映射到小文件,根据题意,100W50B = 5010^6B = 50M,而内存只有1M,故干脆搞一个hash函数 % 50,分解成50个小文件; 针对对每个小文件依次运用hashmap
方法介绍 倒排索引是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,常被应用于搜索引擎和关键字查询的问题中。 以英文为例,下面是要被索引的文本: T0 = "it is what it is" T1 = "what is it" T2 = "it is a banana" 我们就能得到下面的反向文件索引: "a": {2} "banana":
方法介绍 多层划分法,本质上还是分而治之的思想,因为元素范围很大,不能利用直接寻址表,所以通过多次划分,逐步确定范围,然后最后在一个可以接受的范围内进行。 问题实例 1、2.5亿个整数中找出不重复的整数的个数,内存空间不足以容纳这2.5亿个整数 分析:有点像鸽巢原理,整数个数为2^32,也就是,我们可以将这2^32个数,划分为2^8个区域(比如用单个文件代表一个区域),然后将数据分离到不同的区域,
分而治之 方法介绍 对于海量数据而言,由于无法一次性装进内存处理,导致我们不得不把海量的数据通过hash映射分割成相应的小块数据,然后再针对各个小块数据通过hash_map进行统计或其它操作。 那什么是hash映射呢?简单来说,就是为了便于计算机在有限的内存中处理big数据,我们通过一种映射散列的方式让数据均匀分布在对应的内存位置(如大数据通过取余的方式映射成小数存放在内存中,或大文件映射成多个小
本章导读 所谓海量数据处理,是指基于海量数据的存储、处理、和操作。正因为数据量太大,所以导致要么无法在较短时间内迅速解决,要么无法一次性装入内存。 事实上,针对时间问题,可以采用巧妙的算法搭配合适的数据结构(如布隆过滤器、哈希、位图、堆、数据库、倒排索引、Trie树)来解决;而对于空间问题,可以采取分而治之(哈希映射)的方法,也就是说,把规模大的数据转化为规模小的,从而各个击破。 此外,针对常说的
图形研发工程师?我都忘了投的什么了 8道题,没有IDE,代码题也是写纸上上传 图形题 层序遍历,中序遍历,求后序 图形题 不重复N个数找K个最大的,K很小?K很大?写出算法思路、空间复杂度、时间复杂度? 不相邻的数 和最大(dp思路和代码) 五位密码?(考智力?) 圆与多边形位置关系(思路+伪代码) 严格递增再严格递减数组,二分法找最大值代码。
主管: 像你这个不是科班出身的,计网和操作系统肯定基础不好,你只是为了兴趣学习的前端,为了找工作才做的前端的项目和找的实习... 上来带有色眼镜看人,都没问我计网和操作系统的知识,直接就说基础肯定不好; 而且不为了兴趣去学习前端,还为什么学?不为了找工作去实习,还为了啥? 不要非科班,那就hr筛选简历的时候直接刷呗,或者一面直接刷呗,这个主管挺拽的 面经: 1.专业是电子信息,为什么会选择做前端(
Timeline 8.4投递 9.14一面 1.项目介绍 2.项目中碰到的困难?学生工作中碰到的困难?这一块问了好多,可能是对我不感兴趣,但是唠这个我可不困,深究你最后解决的成果 3.常规八股volatile的作用,数组指针和指针数组 4.手写一个将int型变成string型的函数(我问直接to_string行不行,皮了一下),然后用reverse也不让用,swap也不让用还好手撕不难,但是没考虑
8.12 16:10分,专业面试,面试官进来就先让自我介绍,介绍硕士课题。说我的课题更偏向航空航天,为什么会选择储能行业。我的回答是:更期待尝试不同领域的内容。同时询问英语口语怎么样,用英语介绍自己母校,很卡壳。聊的大致都是专业相关内容。 退出会议室是16:18,整个过程才8分钟,估计是觉得还是不对口,直接Pass。 反问问了有几面,共两面,专业面和后续综合面试。
8月19日:投递简历。 8月25日:笔试,三天内答完。 单选18题,20分钟,分值54;多选4题,20分钟,分值16;编程3题,50分钟,分值30。 选择题有些还比较偏,可能没有听说过的知识点,夹杂计算机网络知识。 三道编程题都是手写(word模式,说是问答题?)。第一道打印水仙花数,第二道创建学生表,包含基本信息,并修改增加地址字段,最后编写5条数据插入其中。第三道,创造一个Computer类,
双非本非佬,只是竞赛和开源项目比较多,有个人主页和博客。 海康的校招整体给人的感觉还是比较正式的,有自己的招聘系统,面试(加面除外)前也需要加入钉钉的通知群。 有可能是我投得晚的缘故,流程也是比较紧凑的,面试完第二天就发下一面的通知,流程全长约 1 个月。 性格测试 (2023.10.10) 投递当天收到,没什么好说的。 笔试 (2023.10.11) 笔试题目不难,是一些基础的 C 语言和操作系
单选25*2' 多选10*3' 编程题2*10' 两道编程题一道力扣原题:230二叉树的第k小元素,一道sql题。 这段时间做过的最简单的一次笔试(泪目/(ㄒoㄒ)/~~)#海康威视求职进展汇总#
3月17日 简历投递(邮箱) 3月20日 电话了解 1. 自我介绍 2. 学习成绩如何?四六级情况 3. 哪里人?会不会说粤语? 4. 上半年有没有考研考公就业计划?(然后深入拓展一点) 后面聊了比较多第四点的拓展,就差不多了
双非本985硕,icpc银,一篇一区论文 先自我介绍 1. 介绍其中一篇论文 2. 你的论文结果和其他人的有什么优势? 3. 如何提升这个项目?(换模型,提升并发度) 4. Yolo的正负样本是什么?(与所有真实标签iou都小于阈值的预测框为负样本,反之为正样本) 5. 模型压缩和加速的方法有哪些?(gpu、蒸馏、剪枝、半精度) 6. 半精度是什么?(舍弃后16bit的半浮点数) 7. 半精度的理
海尔智家:国内电商运营一面 三个环节: 1.自我介绍 2.问题环节 (1)电商运营需要哪些能力? (2)你的优势是什么? (3)在过往的实习经历中哪段让你有收获?实习中遇到的最大的困难是什么?如何克服 (4)在过往中遇到的挑战性任务是什么 (5)为家电节活动做策划 (6)如何平衡生活、工作和学习 (7)1-3年的职业规划是什么 (8)意向的工作城市 3.反问 (1)是在原有店铺上进行翻新还是另一个