当前位置：首页 > 专题 >

《大数据测试》专题

平安科技大数据开发
2023/10/10 平安科技大数据开发（37min）（1）自我介绍（2）对于平安科技的数据开发岗的理解和认为它是做什么的？和自己的契合度是怎么样的？（3）数据库学习到哪些东西，学了多久，什么时候学的，有实践过吗？（4）sql分哪几类，违反主键约束会出现什么问题，索引什么情况下回失效，有自己去安装过吗？（之前没准备数据库的内容，答得很差，后边的面试才好好看了数据库的东西）（5）使用sq
某厂外包-大数据开发
1.自我介绍 2.描述一张表的设计流程 3.针对简历提问，问的不算难 4.kafka的用法及途径 5.redis的几种类型（我有写，但是忘了）， 6.有没有bi可视化经验。 ----------------- 是的，没有看错，简历上写的就会可能提问，并不会针对你。
海康大数据算法二面
【30min】自己提到推荐领域和数据挖掘领域，直接就问了两个领域比较熟悉的算法有什么，大概介绍一些不会的： 1. XGB shrinkage 2. FM 算法为什么时间不高 3. 如何将用户之间和物品之间的特征加入协同过滤中（随便说了，特征拼接）比较明确的问题： 1. 随机森林，提升树的区别 2. 随机森林如何构建？特征采样的好处场景题 1. 给出手机的BOM结构图，对于预测手机销量和原材料
字节大数据开发一面
1.自我介绍 2.实习介绍 3.实习工作内容下游使用方主要有那些？ 4.AI团队数据支持他们使用这个数据做的什么 5.除了对表的支持之外，是否在计算层面做过一些优化 6.boradcast join和sortmergeJoin的区别和使用场景的不同然后面试官开始说，我觉得概念你应该都会，我就不问你了，所以我后面会从场景的角度去考验你的技术理解，本人听到这里心凉了半截，因为两段实习全是离线，这
大数据生态圈的理解
HDFS是整个大数据架构的底层，它提供了一个文件系统 Spark(Spark core(RDD)) 和 MapReduce 是一个层级，是一种操作计算框架，MapReduce相当于一个别人写好的 java程序，它并不需要在服务器上启动相应的服务，甚至可以在本地run Hive => MapReduce Hive 操作MapReduce(底层是 MapReduce) Spark SQL=> Spar
京东健康大数据算法
已挂一面没有自我介绍，直接开问；八股考的比较多，论文和实习经历都没怎么问 lgbm和xgboost的区别 RNN, GRU, LSTM之间的差别为什么RNN容易梯度爆炸？进程的通信方式介绍下进程和线程进程是操作系统资源分配的基本单位，而线程是处理器任务调度和执行的基本单位死锁的四个必要条件互斥条件:一个资源每次只能被一个进程使用; 请求与保持条件: 一个进程因请求资源而阻塞时,对
京东-大数据开发凉经
110分钟，全程无项目和算法，全是八股深挖，被拷打惨了 1、谈一谈你对java面向对象的理解，什么时候用接口，什么时候用抽象类，从本质上讲一下区别？ 2、都有了解过哪些设计模式？创建对象的设计模式有哪些？工厂模式和建造者模式分别在什么场景下使用，举一个具体的例子 3、java的hashmap在1.8之前链表中采用的头插法的方式，为什么1.8之后改成尾插法？头插法的方式可能会极限情况连成一个环，举一
安乾国际大数据一面
1.自我介绍 2.MySQL的事务隔离级别，慢SQL排查 3.Redis持久化AOF RDB 、集群、哨兵 4.HashMap 5.线程池
滴滴大数据实习面经
7.11一面： 1.自我介绍 2.拷打项目，项目遇到的难点，怎么解决的。 3.数据倾斜 4.数仓分层怎么做的以及作用 5.对数仓的看法 6.小文件的危害 7.介绍一下yarn 8.java三大特性 7.12二面： 1.自我介绍 2.拷打项目 3.拷打论文 4.实习遇到的难点，怎么解决的 5.一道简单sql 6.能实习多久
PCG大数据后台开发(45min)
腾讯二进宫，秒挂，简单题没写出来，太菜了。。。自我介绍项目相关介绍一下java的反射介绍一下mysql引擎 MyISAM引擎什么时候用讲一下垃圾回收讲一下集合讲一下hashmap 算法题:大数翻转 (乐死了，这么简单的题没做出来，我转了字符串双指针超时) 反问: ∽具体有什么业务提供大数据内容服务balabala ∽技术栈有什么大数据开发岗spark之类，后台开发岗golang
腾讯大数据部门一面
👥 面试题目 1. 字符串串池复用判断题 String str1 = "abc"; String str2 = new String"abc"; String str3 = "abc"; 2. try catch finally的作用；finally一定会执行吗？ 3. Exception &error的区别 unchecked
shein大数据开发实习生
1.自我介绍 2.实习最大收获 3.odps平台的性能调优与spark的性能调优的共同点和差异点 5.spark的countdistinct算子优化 6.bitmap作用在expload的作用是什么？ 7.小文件过多的影响 8.sql countdistinct优化代码手写 9.反问 #大数据开发##数据人的面试交流地#
字节大数据实习三面
对Hadoop的了解 MapReduce的工作流程虚拟内存的工作原理页面置换算法（LRU、FIFO、LFU、最佳置换） Hive的功能和优点常见的数据结构（数组、栈、队列、链表、树、图、堆、散列表）堆的概念及分类常见的排序算法（冒泡排序、选择排序、快速排序）平衡二叉树的定义查找平衡二叉树节点的时间复杂度
美团大数据开发实习
一面——60mins 自我介绍拉链表的制作，数据量有多少，为什么不用快照表呢项目有哪些表数仓分层有哪些，具体做了什么，数仓分层作用怎么设计表，怎么建模，DIM DWD层的主题分了哪些如何做的可视化什么是数据倾斜，数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的对哪些数据库了解 Shuffle有哪几种类型在shuffle的过程中会进行排序吗
小米大数据日常面经
分享一下今天的面试情况，总体其实不难，但真的太过紧张，发挥极其不好。首先上来是一段自我介绍，然后闲聊一些我的能力还有个人对于科研的看法，以及导师的管理松紧。之后就是正式的面试内容： 1.TCP为什么要三次握手？这个题太经典了，想必背过八股的都知道，但我真的太紧张，完全不知道从哪里开始说起，所以结结巴巴的搞完了。 2.线程和进程的区别？这个也很简单对吧，不过我感觉我说的不够全面。 3.Mysql

首页

13

14

15

16

17

18

19

20

21

尾页

最新发布

某一面虾皮 NLP 一面美的寒假实习llm面经蚂蚁大模型算法面经，say something I don't know 百度 llm算法一面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - vu3+vite 使用vue-pdf-embed预览pdf，组件渲染空白，页面无报错，是什么原因？java - @Async("asyncTaskExecutor") 没有并发处理问题？python - 如何查看：pypi中想要看是否哪些包最受欢迎的库？前端 - 可以安装在内网使用的安卓模拟器？前端调用API之后更新状态逻辑：是触发store的方法进行拉取更新是吗，还是说直接修改store进行更新？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

objection Fqutils Gitee dcm4che pg_pathman AndroidJUnit4 reek WebJars

文档资料

小米数据处理和分析服务（EMR）使用指南 iOS 核心动画高级技巧蘋果 Swift 官方教學 v2.0 Effective C++ 中文版跟我学 Spring MVC