Extract / 提取 :从datasource/txt/csv/Excel/等原始数据源中 Extract数据。
Transform / 转换 :将数据预处理,字段补全、类型检查、去除重复数据等,根据预定的条件将数据统一起来。
Load / 装载 :将转换完的数据存到数据仓库中。
Extract - Transform - Load
提取 - 转换 - 装载
Extract - Load - Transform
提取 - 装载 - 转换
ETL和ELT主要是先清洗数据还是先入库的区别。ETL一般使用主流框架用程序在提取的时候就将数据进行清洗,ELT则是将数据存到数据仓库,再用sql进行数据清洗。