空间可视化是地理大数据应用的最后一公里。它涵盖了一系列不同的规模,小到单个房产, 大到全球比例尺的海量地景数据的可视化。空间可视化充分利用了地理信息技术的空间数据可视化能力,用地图的方式进行可视化表达,解决了大数据中空间位置表达的问题;同时,利用地理信息技术的空间分析能力,为地理大数据涉及到的大量空间分析提供了处理能力,在空间维度上初步实现了大数据的分析。 区别于普通空间数据可视化,空间大数据可视
数据可视化是关于数据视觉表现形式的科学技术研究。可视化技术是利用计算机图形学及图像处理技术,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术。它涉及计算机视觉、图像处理、计算机辅助设计、计算机图形学等多个领域,成为一项研究数据表示、数据处理、决策分析等问题的综合技术。 随着大数据时代的来临,信息每天都在以爆炸式的速度增长,其复杂性也越来越高;另外,随着越来越多科学可视化的需
在实例详细信息页面中,点击数据库和表部分下的“查看全部”。“数据库和表”页面会以列表显示服务器中的数据库和表和它们的大小。该列表按大小排序。点击左侧窗格中的实例以跳转到其数据库和表页面。
2023/10/10 平安科技 大数据开发(37min) (1)自我介绍 (2)对于平安科技的数据开发岗的理解和认为它是做什么的?和自己的契合度是怎么样的? (3)数据库学习到哪些东西,学了多久,什么时候学的,有实践过吗? (4)sql分哪几类,违反主键约束会出现什么问题,索引什么情况下回失效,有自己去安装过吗?(之前没准备数据库的内容,答得很差,后边的面试才好好看了数据库的东西) (5)使用sq
1.自我介绍 2.描述一张表的设计流程 3.针对简历提问,问的不算难 4.kafka的用法及途径 5.redis的几种类型(我有写,但是忘了), 6.有没有bi可视化经验。 ----------------- 是的,没有看错,简历上写的就会可能提问,并不会针对你。
【30min】自己提到推荐领域和数据挖掘领域,直接就问了两个领域比较熟悉的算法有什么,大概介绍一些 不会的: 1. XGB shrinkage 2. FM 算法为什么时间不高 3. 如何将用户之间和物品之间的特征加入协同过滤中(随便说了,特征拼接) 比较明确的问题: 1. 随机森林,提升树的区别 2. 随机森林如何构建?特征采样的好处 场景题 1. 给出手机的BOM结构图,对于预测手机销量和原材料
一面 spark数据倾斜 实习相关 二面 Sql 找出最长连续子序列(row_number) 算法 二叉树层序遍历 mapreduce运行过程 spark.shuffle.partitions的调参原理 Spark小文件参数 怎么确定reduce的数量 bucket join优化的原理 怎么快速根据spark stage找到对应的代码 主题域划分 事实表怎么建模 数仓建模过程 事务的特性 进程和线
10.16投递 10.17一面(50minute) 自我介绍 项目细节 mysql(这里问了很多) 大数据的基本八股 计算机网络tcp 一道sql题,一道算法题 (吐槽一下百度的如流,用网页端看不到聊天框,最后还是下载了客户端才看到,面百度的小伙伴记住面试了要下载如流) 反问:问了一下业务 10.19二面(30minute) 自我介绍 项目细节流程 两个项目的关系 为什么不继续做大模型 实习多久
1.自我介绍 2,实习内容 如何实现数据同步 数据同步过程中遇到的问题有哪些 数据同步过后有没有进行验证 你自己设计数据同步系统要注意哪些问题 3,mybatis 与mybatis -plus 的不同之处 4,mysql 怎么优化 对mysql 的看法 5,手撕删除链表的第n个节点 6,jvm了解吗 7,springboot 有看过源码吗 8,动态代理了解吗 感觉不太妙 像是kpi面一样 竟然没有
等的心慌,写面经攒人品 9.15一面(25分钟,纯八股) 问实习的项目 研究生科研项目 疯狂hive,hive调优 一直问联邦学习,问了两遍 等了很久很久才二面,中间还收到了安抚短信。 ———————————————————————————— 9.26二面(30分钟,纯八股) hdfs读写流程 spark算子 spark调优 数据倾斜 对荣耀有什么想了解的(了解到我面试的部门是产品线云服务) 这个
9.11 一面 1.自我介绍 2.介绍实习内容 3.对数仓分层的了解 4.对ab实验的理解 5.对实时了解吗 6.logistic回归的损失函数 7.口述sql:简单窗口 8.反问 9.19约线下,调整成线上 9.26 二面 两个面试官 面试官1: 1.自我介绍 2.更想做数开的工作还是数科的工作 3.解释spark中的水印 4.对实时数仓的了解 5.spark数据倾斜怎么处理 6.设计一个bi产
1.vue和react的区别和相同 2.cookie的生命周期前端在请求头里怎么设置 3.css的流式布局 4.css怎么让一个元素居中对齐 5.跨页面不同源的页面怎么通信(本地,不允许使用代理服务器) 6.node.js如何读取文件 7.node.js怎么利用服务器多核 8.sessionstroge和localstroge和cookie的区别 9.事件冒泡的机制 10.tcp的三次握手,四次挥
一面 实习深挖 对于高耗时任务的代码优化思路 如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗,差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样,容错机制是怎么样 机架感知 有限内存下的一亿数据怎么排序 了解哪些shell命令 有a,b两个文件,存的都是id,写shell找出a中有但b中没有
1.自我介绍 2.rdd变dataframe,再变dataset中间发生的过程 3.项目拷打 4.说说文本处理方法 5.说说数据采集经历 6.颜色分类,操这题还没写对,麻了
20分钟结束 八股:java——hadoop——hive, 再问一问源码有没有看过,如何调试,如何解决异常。