[数据仓库复习] 数据仓库简介小结

DWH 同时被 2 个专栏收录
16 篇文章 1 订阅
18 篇文章 2 订阅

小结

  1. 数据仓库是一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。
  2. 数据仓库中的粒度是指数据的细节或汇总程度,细节程度越高,粒度级别越低。
  3. 数据仓库的数据来自各个业务应用系统。
  4. 很多因素导致直接访问业务系统无法进行全局数据分析的工作,这也是需要一个数据仓库的原因所在。
  5. 操作型系统是一类专门用于管理面向事务的应用信息系统,而分析型系统是一种快速回答多维分析查询的实现方式,两者在很多方面存在差异。
  6. 构成数据仓库系统的主要组成部分有数据源、ODS、中心数据仓库、分析查询引擎、ETL、元数据管理和自动化调度。
  7. 主要的数据仓库架构有独立数据集市、从属数据集市、Inmon企业信息工厂、Kimball多维数据仓库、混合型数据仓库。
  8. ETL是建立数据仓库最重要的处理过程,也是最体现工作量的环节。
  9. Kettle是常用的开源ETL工具,现在还有Talend等比较常用的ETL工具。
  10. 数据仓库的基本需求是安全性、可访问性、自动化,对数据的要求是准确性、时效性、历史可追溯性。

参考资料

[Book]Hadoop构建数据仓库实践, 第1章第6节 —— 小结

  • 1
    点赞
  • 0
    评论
  • 0
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
©️2020 CSDN 皮肤主题: 技术黑板 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值