当前位置：首页 > 专题 >

《大数据》专题

科大讯飞大数据开发工程师 1面已挂
45min 自我介绍数仓项目的数据采集模块怎么做的 flume组成，各个模块的功能为什么要使用这些source或者是sink file channel和memory channel有什么区别，分别在什么场景使用 flume内部原理 sink消费能力弱，channel会不会丢失数据数千台机器需要采集日志小文件到hdfs上，该怎么办？数千个flume要怎么统一配置，修改就分发吗？ maxwel
大数据面试大厂真题【附答案详细解析】
1.Java基础篇（阿里、蚂蚁、字节、携程、快手、杭州银行等）问题：HashMap的底层实现原理答案：在jdk1.8之前，hashmap由数组-链表数据结构组成，在jdk1.8之后hashmap由数组-链表-红黑树数据结构组成；当我们创建hashmap对象的时候，jdk1.8以前会创建一个长度为16的Entry数组，jdk1.8以后就不是初始化对象的时候创建数组了，而是在第一次put元素
2018全球大数据产业将呈七大发展趋势
主要内容：大数据大数据达沃斯世界经济论坛等全球性重要会议都把“大数据”作为重要议题，进行讨论和展望。而随着大数据发展日新月异，我们国家也在审时度势、精心谋划、超前布局、力争主动。本报精心策划，就全球大数据发展趋势，中国的机遇和挑战，大数据发展法制建设等展开调研和采访。 “大数据”是今年达沃斯世界经济论坛的热词之一，与会各界都对云计算、大数据等驱动经济数字化转型因素表达了高度关注。而在年初举办的2018拉斯维加斯
从Redis检索大型数据集
问题内容：一台服务器上的应用程序查询在另一台服务器上运行的redis。来自查询的结果数据集大约为25万，在应用服务器上似乎需要40秒。在redis服务器或app服务器上使用命令执行命令时，在两种情况下，它们都需要大约40秒才能完成，如所述。在查询期间，redis服务器使用大约15％的CPU。问题：花费40秒检索250k记录是否很慢？是否有可能将其加速到几秒钟？问题答案：首先，它取决于
使用JList显示大量数据？
问题内容：我有一个JList，必须显示3000多个项目。我希望列表中有100个左右的“可见”项，并且当您滚动并接近“可见”项的末尾（或开头）时，必须在列表中加载下一部分（约50个）。有没有简单的方法可以做到这一点？问题答案：不，没有简单的方法，您必须实现分页由数据库引擎管理时最简单的工作，然后大多数直接支持分页在模型中，但是我从未见过XxxListModel的解决方法，而是将JTable
数据协议URL大小限制
问题内容： “数据：” URL方案值是否有大小限制？我对流行的Web浏览器中的限制感兴趣。换句话说，多久可以成为或？问题答案：简短答案：数据URI限制有所不同。有很多答案。正如5年前提出的问题一样，大多数问题由于过时而现在不正确，但是这个问题排在Google结果“数据URI限制”的顶部。数据URI现在得到广泛支持，并且IE 7/8不再是相关的浏览器。下面有许多参考文献，因为今天的答案是微妙的
mysql批量删除大量数据
本文向大家介绍mysql批量删除大量数据，包括了mysql批量删除大量数据的使用技巧和注意事项，需要的朋友参考一下 mysql批量删除大量数据假设有一个表(syslogs)有1000万条记录，需要在业务不停止的情况下删除其中statusid=1的所有记录，差不多有600万条，直接执行 DELETE FROM syslogs WHERE statusid=1 会发现删除失败，因为lock wai
使用OpenNLP训练大数据集
我有文件及其非常大的文件说100MB文件。我想执行NER以提取组织名称。我使用OpenNLP进行了培训。示例代码：但是我得到了一个错误：。有没有办法使用openNLP for NER来训练大型数据集？你能发布示例代码吗？当我谷歌时，我发现Class GIS和DataIndexer界面可用于训练大型数据集，但我知道如何训练？你能发布示例代码吗？
选择SQL Server数据库大小
如何查询我的sql server以仅获取数据库的大小？我用了这个：我得到了这个：它返回我几个列，我不需要，也许有一个技巧，从这个存储过程中选择database_size列？我还尝试了这段代码：它给了我这个结果：所以我写了这个：我得到：1183 所以它是有效的，但也许有一个合适的方法来得到这个？
Android.os.TransactionToolargeException：数据包大小565156字节
我有fragmens的viewpager，在这么多卷轴应用程序崩溃后，说翻边，甚至他们是没有捆绑交换在监视的时候，我发现下面的钥匙造成了碰撞这些都是有缺陷的，我没有分配任何捆绑我如何可以解决这个问题。
为大数据生成最佳UUID
“...如果这不可行，RFC4122建议使用命名空间变体，如类型5 UUID。” 我计划使用Java生成UUID，并引用了API https://docs.oracle.com/javase/8/docs/API/Java/util/UUID.html 通过维基百科：
喜马拉雅大数据测试
大致是下面这些问题（顺序不记得了） 1 自我介绍 2 软件测试方法 3 微信发红包设计测试用例 4 mysql数据库基本命令 5 linux命令常用哪些 6 Python了解哪些；Python有哪些数据类型；Java了解哪些？数据库 Tomcat连接的过程是什么？ 1-100里面能被3整除的数有哪些？不限制语言，可以写出代码吗？ 7 接口测试了解哪些 8 如何判断前端问题还是后端问题 9 如果
百度大数据一面面经
0：自我介绍必不可少的 1：数仓的数据从哪里来的？多少数据？ 2：数仓分层 3：DWD层如何保证和ODS层的一样的数据粒度，如何提供数据质量保证？ 4：什么阶段进行数据清洗？ 5：数据量很大的时候每层都进行数据清洗吗？如何解决 6：ETL过程中，数据出现问题了如何预警？ 7：团队合作的时候如何保证数仓分层的规范？ 8：Hive的调优（项目写到了这个） 9：什么是zookeeper？ 10：zook
海康威视大数据一面
30左右的一位前辈 25min 自我介绍为什么选择大数据这个方向从想要计算的效果，各方面使用的组件，还有最后的结果来介绍下项目为什么用ES 项目难点说一下说一下你是怎么理解Spark 的说一下Java 多线程 Java 讲一下锁机制，说一下读写锁的实现原理 JVM 垃圾回收机制讲一下反问业务场景？主要的难点？ #海康威视##大数据开发工程师#
顺丰大数据开发一面
30min 自我介绍项目介绍项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用，具体是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程，写到一半client发生OOM之后该怎么办，datanode宕机怎么办怎么实现nn切换，而客户端无感的 Spark提交作业的流程 Executor内存管理，分别存储什么 spark shuffle有哪些，讲一下

首页

6

7

8

9

10

11

12

13

14

尾页

最新发布

长沙银行货拉拉应用运维实习拼多多面试华为运营经理面经（我跑了）我的面试经历

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

echarts - 如何用echart做一个有厚度的、正面视图的饼图呢？前端 - 求助，如何解决vite.config.js代理配置失效问题?前端 - Ant Design Vue Tree组件拖拽功能中dropToGap和dropPosition的含义是什么？php实现图片序列合成视频？javascript - 为什么节流函数中的定时器ID没有按预期变化？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Script.NET Deis MultiTablesView MiniExcel JasperServer HeyUI Admin jQuery slimscroll maple-bbs

文档资料

Serverless 应用开发指南 Vim 入门教程 AngularJS 中文教程下一代 Web 框架 Koa 快学 Scala 读书笔记