刚面完,人工智能与智慧运营中心, AI 算法工程师岗 -机器学习模型有哪些挑一个说说原理介绍一个--简历里的项目或论文,然后顺着这条线问了很多 -数据不平衡时有哪些解决方案 -又问项目论文 -PyTorch 基本操作,怎么构建一个网络,优化器有哪些一般你用哪个,梯度清零的方法名叫啥 很多都没有回答好... 他们感觉很在意要面够20分钟这个点,最后几分钟说了好几次“到20分钟了吧”。面试的是两个小姐
一面 1. 挖简历 2. python部分: list和tuple的区别 python的深浅拷贝使用场景,以及python为什么默认使用浅拷贝(不会) 3. 算法部分: CNN的pooling部分是怎么进行反向传播的:meanpooling将梯度值平均传播给上一层,maxpooling则在前向传播的时候记下max值的位置,反向的时候将梯度值传播到该位置,其他位置为0 如何缓解梯度消失 4. 手撕代
面了差不多有四十分钟 ①首先问了下项目flume 和 kafka相关,由于很久没复习这两个组件,回答的不好 ②说一下HDFS读写原理 ③JVM内存区域介绍一下 ④有哪些垃圾回收器,你就说CMS就行了,他的基本原理以及优缺点,其中四个阶段哪些阶段需要stop the world ⑤Java对象内存是如何分配的,有哪些分配方法? ⑥分配对象的过程中会出现并发问题吗,JVM是如何解决的? ⑦有用过JVM
一面1h [项目] - [ ] 项目设计和技术栈的使用 - [ ] FastDFS的架构设计 - [ ] 追踪器是单点还是多点,占多少内存量 - [ ] 源文件保存在哪儿 - [ ] 文件上传下载的步骤,以及数据库的映射关系 - [ ] 怎么实现IO多路复用 - [ ] 了解的数据结构 - [ ] 红黑树的时间复杂度为什么是logn 算法- [ ] 1-n个数,有m条边描述相连的两个数,输入任意两
字节大数据开发工程师- 人力科技面经 一面 网络模型,每一层的功能 访问一个网页的流程 tcp是如何保证可靠 线程和进程的区别 JVM的内存区域 垃圾回收算法 类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag,job,task是如何划分的 spark宽窄依赖 为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
笔试:选择题+填空题+判断题+简答题 简答题 1、说说大数据技术的特点 2、说一下Spark任务执行的流程 3、1G的文件,每一行是一个词,词大小不超过16字节,内存1M,找出频数最高的100个词。 技术面 1、自我介绍 2、本专业主要学什么? 3、介绍一下实习的项目 4、小文件问题怎么处理?(SequenceFile、CombineInputFormat、JVM重用) 5、Hive支持哪些存储格
1、自我介绍 2、什么是维度建模?什么是关系建模? 3、星型模型和雪花模型有什么区别? 4、数据仓库分层的意义是什么? 5、对哪些大数据框架比较熟悉?(答了Hadoop和Kafka) 6、Hadoop的进程有哪些?作用分别是什么? 7、Kafka的特点是什么? 8、Kafka为什么可以支持海量数据吞吐? 9、问实习工作内容,以及实习收获 10、能否接受加班? 11、有什么问题要问我的?问了日常工作
一面 12月28日 15:00 1h 了解分布式吗,看过哪些相关的分布式数据库和知识 看过哪些论文 深挖minisql项目 2PL 脏读,幻读,不可重复读 这个项目是怎么实现的,从0到1吗,介绍一下实现的过程 支持哪些SQL数据类型 日志系统的设计(支持哪些日志格式) 如果用户写入一个大的blob日志怎么处理 fsync怎么处理的 redo log在commit之前还是之后处理的 是否有丢失数据的
1 介绍下你自己 我按照常规的套路,先自我介绍,然后介绍我的项目,想引导着问些八股,但是好像没用😂 2 32位和64位你能联想到什么,从机组操作系统,数据结构等角度,开放性的谈一下你的理解😂😂 这个问题直接问了15分钟 3 手撕代码 给你一个应用场景,设计合适的数据结构,并完成两个功能函数 看出来是树了😂😂,但是没咋刷算法,以为只问sql,我的格局小了,写了二十分钟,一点不会😂😂 总
自我介绍 1.类里面默认的函数 2.构造函数能不能是虚函数,为什么 3.指针和引用区别 4.c++特性 5.继承和重写 6.select和echo 7.指针数组和数组指针的书写 8.二维数组按行遍历和按列遍历效率 9.多个人围成一圈 10.单链表中心节点 11.结构体和类的区别 12.数组越界没有占用其他内存空间对其他线程会不会有影响 13.内存泄漏后进程结束后对系统的危害
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储,为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
大概是今年五月初面试了荣耀大数据的Java开发港,面试官全程基本什么都没有问。也没有问一些八股文的问题,也没有问算法题。 就是轻蔑地看了一眼我的简历,然后问你的项目是自己做的,还是根据别人的来做的,然后直接说你做的这个项目怎么这么简单,因为我还有一个机器学习的项目,然后他就随便问了项目做什么的。 最离谱的是他说你有机器学习的经历,那么我推荐你去客户端。 总之全程什么技术问题都没有问你,也没有问项目
前言 星环感觉整个流程非常不错,二面面试官不是搞大数据的,但是交流上感觉到了尊重,面试实在7月份,八月份就给意向了,进展到十月份了对比看来星环流程真的不错(PDD推荐组某个面试官一生黑),看到大数据后端已经不招人了,但是可能会拒掉 一面 忘记了没有记录 二面 1.1. HBASE架构 1.2. Regionserver结构 1.3. Hbase避免热点数据(Rowkey的设计) [大白话彻底讲透
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的