課程介紹
數據倉庫是一個面向主題的、集成的、隨時間變化的、但信息本身相對穩定的數據集合,用于對管理決策過程的支持。
培訓對象
學員需具備:
至少熟悉掌握一種關系型數據庫使用;
開發工程、運維工程師、測試工程師。
課程收益
數據倉庫就是整合多個數據源的歷史數據進行細粒度的、多維的分析,幫助高層管理者或者業務分析人員做出商業戰略決策或商業報表。
知識概要
-- 數據倉庫建模設計方法;
-- 開發體系規范和開發。
課程大綱
數據倉庫建模設計方法-1
為什么需要模型
模型的組織結構
模型實施方法
模型設計策略
數據倉庫設計方法概述
DW設計與DB設計
DW設計的三級數據模型
性能問題
數據倉庫中的元數據
數據倉庫設計的原則
在實際工程中的設計方法
數據驅動系統設計方法的基本思路
數據倉庫設計步驟
概念模型設計
邏輯模型設計
物理模型設計
數據倉庫生成
數據倉庫的使用和維護
數倉—主題域&&數據域
數倉—建模方法論
數倉—維度表概念及設計案例
數倉建模—寬表的設計
數倉建模分層理論
數倉建模方法論
數據倉庫建模設計方法-2
數據倉庫架構、分層和建模
為什么要分層
數倉命名規范
表命名/腳本命名/表字段類型
范式理論
范式概念/函數依賴/三范式區分
關系建模與維度建模
關系建模/維度建模
維度表和事實表(重點)
維度表/事實表
維度模型分類
數據倉庫建模(絕對重點)
ODS層/DIM層和DWD層/DWS層與DWT層/ADS層
開發體系規范和開發
HIVE數據倉庫開發規范
HIVE-sql開發及優化
Spark-sql開發及優化
認證過程
無認證考試
開班信息
暫無開班信息