当前位置: 首页 > 编程笔记 >

Data Lake和Datawarehouse之间的区别

裴宜春
2023-03-14
本文向大家介绍Data Lake和Datawarehouse之间的区别,包括了Data Lake和Datawarehouse之间的区别的使用技巧和注意事项,需要的朋友参考一下

数据湖和数据仓库都用于存储大数据

数据湖是一个很大的存储库,用于存储原始的非结构化数据,机器对机器,实时流经的日志。未在数据湖中定义存储数据的目的。它们被存储以用于将来的数据分析。

数据仓库是用于结构化,经过过滤的数据的存储库,该数据已经过特定用途的处理。数据软件从多个来源收集数据,并使用ETL流程转换数据,然后将其加载到数据仓库中以用于业务目的。

序号 数据湖 数据仓库
1
基本的
数据湖是一个很大的存储库,用于存储原始的非结构化数据,机器对机器,实时流经的日志。
数据仓库是用于特定目的的结构化,经过过滤的数据的存储库
2
归一化
数据格式不规范
数据仓库具有非规范化架构
3
模式创建
加载数据后创建架构
在加载数据之前创建架构
4
ELT / ETL
它使用了ELT工艺
它使用了ETL流程
5
用途
对于那些需要深入分析的人来说是理想的选择
对操作用户来说很好
 类似资料:
  • 问题内容: 我错放了太多次了,我想我一直忘记,因为我不知道两者之间的区别,只是一个给了我我期望的价值,而另一个却没有。 为什么是这样? 问题答案: 是的简写形式(尽管请注意,该表达式只会被计算一次。) 是的,即指定一元的到。 例子:

  • 问题内容: 因此,我有一段简单的代码可以打印出整数1-10: 然后,如果仅在第3行上更改一个运算符,它将打印出无限数量的1整数(我知道为什么会这样做)。为什么在运行第二个程序时没有出现语法错误?如果赋值运算符后面跟着一个加法运算符,它不会调用语法错误吗? 问题答案: 与相同, 只是意味着。

  • 问题内容: 有人可以解释一下 和 我不知道“确切”的含义 问题答案: 在这个例子中,什么都没有。当您具有多个具有相似名称的路径时,该参数将起作用: 例如,假设我们有一个显示用户列表的组件。我们还有一个用于创建用户的组件。的网址应嵌套在下。因此,我们的设置可能如下所示: 现在,这里的问题是,当我们转到路由器时,将通过所有定义的路由,并返回它找到的第一个匹配项。因此,在这种情况下,它将首先找到路线,然

  • 问题内容: 我很好奇printStackTrace()和toString()之间的区别是什么。乍一看,他们 似乎 做的完全相同。 码: 问题答案: 不,有重要区别!使用toString,您只有异常的类型和错误消息。使用printStackTrace()可以获得异常的整个堆栈跟踪,这对于调试非常有帮助。 System.out.println(toString())的示例: printStackTra

  • 问题内容: 我看不到两种方式之间的任何区别,@ Qualifier 始终与 @Autowired一起使用 。 VS 有人能让我知道其中的区别吗?谢谢! 问题答案: 可以单独使用。如果单独使用,将按类型进行接线。因此,如果在容器中声明了多个相同类型的bean,而又不知道要注入哪个bean,就会出现问题。结果,通过指定Bean名称(按名称进行绑定),与一起使用来阐明要实际连接的Bean 也按名称接线。