我正尝试使用以下指南在伪分布式配置中设置Hadoop 0.20.203.0版本: http://www.javacodegeeks.com/2012/01/hadoop-modes-explained-standalone.html 运行脚本后,运行“jps”。 我有个错误: 我不完全确定,但我相信这可能与datanode没有运行有关。 有谁知道我做错了什么,或者怎么解决这个问题吗? 编辑:这是d
字节跳动 - 数据研发 一面(40min) 学过的数据结构,并分别讲下它们的特点 进程和线程的区别 TCP和UDP的区别 JAVA的面向对象的三大特性,并详细介绍应用场景 MySQL的事务隔离级别 MySQL的binlog的运用 数据仓库的的特点、数据治理 范式建模、维度建模 Hive内外部表的使用场景 HQL底层执行逻辑 Hive数据存储在哪,分区和分桶的区别 Sort by 和 Order b
一面电话面20min(9.28) 把能记住的问题做一个记录 java集合有哪些,从上到下,挨个说一下 锁机制,synchronized和lock(主要是Reetrantlock,例如怎么申请锁的)以及区别? 在Reetrantlock中如何实现像synchronized中的wait和notify机制 Spring中AOP的各种参数(target、joinpoint之类的)说明 Spring如何解决
50 min 一位很友好的前辈 9.2 面 9.16日挂 Warm up 自我介绍 对大疆有什么了解 为什么选择这个岗位 项目相关 无人车项目 SLAM 主要是视觉SLAM 还是激光雷达SLAM,还是两者融合的? 知道哪些点云的格式? 有用过大疆的产品做SLAM吗? 项目难点在哪? Spark项目 Kafka 在项目中主要是用来做什么的? Kafka 如何保证顺序读取消息? 如何保证幂等写? 使用
1、自我介绍 2、介绍一个自己熟悉的项目 3、针对项目进行发散性提问:几乎一个没答上来,自己学的太浅了,哎!!!! 说是针对项目,但提问大部分比自己做的深,基本不会,只能疯狂“没接触过”、“我不会”。。。 4、反问,没啥好问的,下一个吧
bg: 双9无实习有论文cpp选手,零测开经验 🕒 8.27 一面 几乎纯聊天,有说有笑就过去了。 先让自己整体介绍一遍自己的研究生项目,然后根据项目提问。因为具体细节和测开技术栈不搭边所以面试官就问了一些业务方面的问题,比如做的东西难点在哪,成本怎么降之类的。 🕒 9.19 二面 应该是leader+1面,主要考察项目细节和反思/创新能力。 深入拷打项目细节,然后连着问了两次你会去怎么改进,
7.20 笔试 三道编程全a了 8.8 一面 40min 基本都是在问项目,对着我的Webserver中的技术细节狠狠地问。然后别的项目稍微问了点。 知识点方面甚至就问了个面向对象三大特性,函数重载属于哪个,为什么。 无手撕。 8.16 二面 40min 说是业务面试,但感觉基本都是在聊天。 比如大学生活中印象最深刻的事,手机里认为最有价值的五款APP(好奇特的问题),认为最有用的一门课等问题。
项目相关 项目业务逻辑 微服务项目代码怎么组织,都在一个仓库吗 微服务拓扑图 MongoDB 想对指定 id 的某一个 document 进行自增,怎么实现( 就行,但我忘记了,说了在业务层的实现方式) MySQL 如果使用 MySQL,怎么实现原子自增(共享屏幕,写 SQL,但太久没写 SQL 了没写出来) 计算机网络 HTTP 格式 Java 接口和抽象类有什么区别与联系,说说使用场景 讲讲
Redis 项目中说用 Redis 维持了用户登录状态,怎么实现的,还有其他实现方式吗 Redis 的主从原理 什么是增量复制 什么时候进行全量复制 Redis 有哪些持久化方式 说说 AOF RDB 的原理呢 Redis 有哪些具体的数据结构,你都用过吗 Set 和 Zset 你会在什么时候用呢 MySQL & 锁 讲一下脏读和幻读的区别 怎么解决脏读和幻读的问题 MVCC 怎么解决脏读 MyS
项目相关:能简单介绍一下项目“xxxx平台”是做什么的吗,“xx生成”是使用人工智能算法吗,人工智能有可能不准啊你怎么提高正确率,算法调优是你在做吗,能讲下整套系统的架构、每个组件有什么作用吗,授权认证不是在网关里做的吗,能讲下 JWT 的工作原理吗,JWT 和 Session、Cookie 有什么关系吗,JWT 不依赖 Cookie 那一套实现吗 类里有哪些方法,每个方法有什么作用 和 方法有什
1.自我介绍 2.介绍第一篇论文和第二篇论文(面试官很认真在听,问了很多细节问题)30min 3.写代码题 给定一个数n和一个int数组A,选取A中元素组成一个最大的且小于n的数,可以重复选取 4.反问组里工作内容 #字节# #字节跳动#暑期实习#
0:自我介绍必不可少的 1:数仓的数据从哪里来的?多少数据? 2:数仓分层 3:DWD层如何保证和ODS层的一样的数据粒度,如何提供数据质量保证? 4:什么阶段进行数据清洗? 5:数据量很大的时候每层都进行数据清洗吗?如何解决 6:ETL过程中,数据出现问题了如何预警? 7:团队合作的时候如何保证数仓分层的规范? 8:Hive的调优(项目写到了这个) 9:什么是zookeeper? 10:zook
问题 你想读写二进制文件,比如图片,声音文件等等。 解决方案 使用模式为 rb 或 wb 的 open() 函数来读取或写入二进制数据。比如: # Read the entire file as a single byte string with open('somefile.bin', 'rb') as f: data = f.read() # Write binary data to
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
1)10道不定向选择题,共40分,包括知识点: 关系型数据库 有限自动机 进制转化 HIVE特点、复杂数据类型 Flink窗口分类、通过什么方式处理数据迟到、时间语义 SPARK RDD特性 LSM 2)1道数据库,给出一个表,包括三个小题: 1. 玩家在线时间排名 2. 计算 pv, uv 3. 计算第一天留存率 3)2道编程题,题目描述中有说 若写不出来 也可以在注释中写思路或伪代码 1. J