当前位置：首页 > 专题 >

《大数据研发实习》专题

使用sqlplus检索大型clob数据
null 由于oracle clob字段可以包含4GB(max)的数据，是否有使用SQLPlus获得完整数据块的正确方法？我可以把它作为文件下载吗？我希望问题是清楚的。我更喜欢在不向数据库注入PL/SQL过程的情况下做到这一点。
Java夸大原始数据的异常
我试图用java解码JWT负载，但是这个负载被压缩/压缩了 JAVAutil。拉链DataFormatException:标头检查不正确其他一些使用其他编程语言的人能够用这个解决这个问题，他们想知道我将如何用java实现这一点？
大数据（MapReduce）面试题及答案
介绍下MapReduce ● 1.1 MapReduce定义 ○ MapReduce 是一个分布式运算程序的编程框架，是用户开发“基于 Hadoop 的数据分析应用”的核心框架。 ○ MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并行运行在一个 Hadoop 集群上。 MapReduce优缺点 ● 1.2 MapReduce优缺点 ○ 1.2.
大数据（Yarn）面试题及答案
介绍下YARN ● Yarn 是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。 YARN有几个模块 ● Yarn架构 ○ ResourceManager（RM）： ○ NodeManager（NM）： ○ ApplicationMaster（AM）： ○ Container： YARN工作
字节大数据岗一面-面经
字节面经项目的数据来源和的数据的规模 Spark Shuffle spark的宽窄依赖数据倾斜问题（★★★★★）产生数据倾斜的原因遇到过的数据倾斜的实际情况数据倾斜的解决办法介绍一下hadoop的NameNode NameNode高可用架构 NameNode主节点宕机，之后的选取机制 Zookeeper的选取机制 NameNode中的元数据是否会丢失？（★★★★★）怎么保证元数据不丢
茄子快传大数据一面挂
1.mapreduce的shuffle过程。 2.海量节点的情况下，NameNode如何扩展用多台NameNode保存元数据。 3.多个NameNode，其中一个NameNode挂了，其它NameNode如何上线。 4.海量的（userid,pageid）二元组数据，内存小的情况，用java或者sql计算每个pageid的userid top10的方法？ Java：数据切块并按pageid分区，每
腾讯TEG大数据一面面经
写面经攒人品，同时也是对自己的实习面试的一个记录吧 1.介绍项目，因为是密码学项目，面试官可能不是很了解，但是抠得很细，一直问到他大概明白是做了什么为止 2.智能指针 3.协程 4.Java线程池 5.Redis布隆过滤器 6.数据结构中序遍历 7.有没有在C++中引用过第三方包 8.手撕算法:给一个数字串，相邻两个字符相加为10可以消去，问最终字符串长度 9.介绍了一下所接触过的其他加密算法面
美团大数据基架一面20230407
1小时，全程 LSM tree 深挖 LSM-tree 存储引擎和 Raft 的关系 LSM-tree 原理和特点为什么要追加写 LSM-tree 的工业实现 LSM-tree 的合并方式（合并超出阈值的部分还是全部？优缺点 Bloom filter 的实现 Bloom filter 如何持久化缓存的索引怎么做缓存淘汰缓存的索引一个 SSTable 对应一个 map 和用一个全局 map 的
Excel 数据透视表应用大全
Microsoft Excel 的功能真的可以用博大精深来形容。特别是自Excel 2007 在原有的基础上又增加了一些更简单易用的功能。特别是数据透视表功能，更被认为是Excel 的精华所在。本文从创建数据透视表到使用数据透视表查看、汇总、分析数据，还包括数据透视表的布局控制，数据透视表的数据源更新与链接等功能都做了详尽的介绍。
大数据工程师技能图谱
大数据通用处理平台 Spark Flink Hadoop Drill 分布式协调 ZooKeeper 分布式存储 HDFS Alluxio(tachyon) Ignite 存储格式 Parquet ORC CarbonData Kudu 数据库 HBase 资源调度 Yarn Mesos Kubernetes 工作流调度 Oozie Azkaban 机器学习工具 Mahout Spark Mlib
博世大数据一二面一面
一面英文自我介绍 mr的shuffle zookeeper选举 spark内存管理 hbase中region的拆分数仓中都有什么表怎么处理缓慢变化维，拉链表有用过吗 yarn的架构 namenode ha的实现 namenode启动过程中怎么确定哪个是active哪个是standby spark sql用的多吗手撕中等leetcoode，合并区间二面自我介绍家哪里的对博世有什么了
11.7字节大数据一面已过
1.自我介绍 2.对于岗位理解 3.对于大数据经典组件的简要介绍 4.spark出现明显解决hadoop什么问题 5.sparkrdd的内存管理机制 6.spark提交任务后集群的内存管理机制 7.实习工作介绍 8.谈论对于优化的理解 9.评价方法论，衡量优化工作的指标 10.对于最左匹配原则的理解 11.为什么联合索引的后面字段不走联合索引 12.sql，直播间峰值问题，说了开窗函数排序的思路，
10.12-猫眼-大数据-一面+二面
一面面试时间：70min 自我介绍 Java数据类型？ String builder和String buffer区别？ String为什么是不可变的？为什么要设计成不可变？泛型了解吗？反射了解吗？常用的反射方法？ Java集合类型？数组和链表的区别？讲讲HashMap原理？转换成红黑树条件？为什么这么设计？线程安全的HashMap？ConcurrentHashMap和HashTable
腾讯大数据 Java一面面经
已挂实习时间自我介绍了不了解 go（不了解） redis 为什么快 redis 多线程 redis 实现分布式锁 MySQL 底层索引 B+树事务四大特性分库分表分库分表怎么精准定位 TCP 三次握手、四次挥手 HTTP、HTTPS 的区别 SSL/TLS 消息队列的作用堆和栈的区别（数据结构）了不了解 linux（不了解）线程和进程的区别死锁的概念死锁产生的条件项目反问
饿了么大数据一面秒挂？
自我介绍数据结构数组和链表的区别 java中哪里用到了这两个数据结构栈和队列的区别网页的前进和后退都是使用哪个数据结构 arraylist和linkedlist的区别看过哪些书 mysql的索引 b树和b+树的区别，b+树的优点如果使用mysql存1000w行数据，设计方案如果设置索引，那么存储索引也会占用很大的空间，怎么解决数仓的项目，怎么分层的为什么要分层每层干了什么事反

首页

62

63

64

65

66

67

68

69

70

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Apprise RubyCritic Sonar Runner how-to-npm DiskGenius cmwrap Evernote SDK for iOS Easy-Monitor

文档资料

一个月纯 JS 挑战中文指南 Windows App 应用开发教程 IIS 管理控制器帮助手册 v6.0 Twisted 与异步编程入门 Vuetify 中文文档