2024-01-03
(以下文章來源于大飛談技術 ,作者常大飛)
為了清晰數(shù)據(jù)結構,方便數(shù)據(jù)血緣跟蹤,減少重復開發(fā),簡化復雜問題,屏蔽原始數(shù)據(jù)的異常與業(yè)務的影響,在設計數(shù)據(jù)倉庫體系時通常需要對其邏輯分層。
1. 清晰數(shù)據(jù)結構一般我們將數(shù)據(jù)倉庫分為ODS層(原始數(shù)據(jù)層)、DWD層(明細數(shù)據(jù)層)、DWS層(數(shù)據(jù)匯總層)和ADS層(數(shù)據(jù)應用層)。每一個分層都有它自己的作用域,并且我們在設計數(shù)據(jù)倉庫時會為每個分層的表設置各自的命名規(guī)范,這樣我們在使用表的時候能更方便的定位和理解數(shù)據(jù)。另外,數(shù)據(jù)倉庫的數(shù)據(jù)是來源于不同的業(yè)務系統(tǒng),比如客戶信息同時存在于CRM系統(tǒng)、訂單系統(tǒng)、營銷系統(tǒng)等,取數(shù)時該如何決策呢?數(shù)據(jù)倉庫會對相同主題的數(shù)據(jù)進行統(tǒng)一建模,把復雜的數(shù)據(jù)關系梳理成條理清晰的數(shù)據(jù)模型。
2. 數(shù)據(jù)血緣跟蹤通過數(shù)據(jù)倉庫中的邏輯分層,確定每一層的數(shù)據(jù)來源,如果有一張來源表出問題了,我們能夠快速準確地定位問題,并清楚的知道它的影響范圍。同時我們會制定每一層的調(diào)用規(guī)范:
4. 復雜問題簡單化將一個復雜的任務分解成多個步驟完成,每一層只處理單一的步驟,比較簡單且容易理解,便于維護數(shù)據(jù)的準確性。當數(shù)據(jù)出現(xiàn)問題之后,可以不用修復所有的數(shù)據(jù),只需要從有問題的步驟開始修復。
5. 屏蔽原始數(shù)據(jù)異常對業(yè)務的影響數(shù)據(jù)倉庫對接的源系統(tǒng)眾多,且每個源系統(tǒng)的表命名、字段命名、字段含義等各有不同,通過數(shù)據(jù)倉庫的分層設計,從底層來規(guī)范和屏蔽所有這些復雜性,保證下游數(shù)據(jù)用戶使用數(shù)據(jù)的便捷和規(guī)范。如果源系統(tǒng)發(fā)生變更,只需要再相應的數(shù)據(jù)倉庫層來處理,對下游用戶透明,無感。
完 謝謝觀看
上一篇: 什么是業(yè)務場景 下一篇: 如何看懂公司的商業(yè)模式
CDA認證
關于CDA考試 最新考試安排 考試報名入口 CDA證書查詢CDA合作
CDA教育 Pearson CVA協(xié)會 電子工業(yè)出版社關注CDA
關于我們 Email:exam@cdaglobal.com 電 話:010-68454276 微 信:15311595173