午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

CDA數(shù)據(jù)分析師

CDA數(shù)據(jù)分析師

考試報名
考試報名
考試內(nèi)容
考試大綱
在線客服
返回頂部

為什么要對數(shù)據(jù)倉庫進行分層設計?

2024-01-03

(以下文章來源于大飛談技術 ,作者常大飛)

為了清晰數(shù)據(jù)結構,方便數(shù)據(jù)血緣跟蹤,減少重復開發(fā),簡化復雜問題,屏蔽原始數(shù)據(jù)的異常與業(yè)務的影響,在設計數(shù)據(jù)倉庫體系時通常需要對其邏輯分層。

1. 清晰數(shù)據(jù)結構一般我們將數(shù)據(jù)倉庫分為ODS層(原始數(shù)據(jù)層)、DWD層(明細數(shù)據(jù)層)、DWS層(數(shù)據(jù)匯總層)和ADS層(數(shù)據(jù)應用層)。每一個分層都有它自己的作用域,并且我們在設計數(shù)據(jù)倉庫時會為每個分層的表設置各自的命名規(guī)范,這樣我們在使用表的時候能更方便的定位和理解數(shù)據(jù)。另外,數(shù)據(jù)倉庫的數(shù)據(jù)是來源于不同的業(yè)務系統(tǒng),比如客戶信息同時存在于CRM系統(tǒng)、訂單系統(tǒng)、營銷系統(tǒng)等,取數(shù)時該如何決策呢?數(shù)據(jù)倉庫會對相同主題的數(shù)據(jù)進行統(tǒng)一建模,把復雜的數(shù)據(jù)關系梳理成條理清晰的數(shù)據(jù)模型。

2. 數(shù)據(jù)血緣跟蹤通過數(shù)據(jù)倉庫中的邏輯分層,確定每一層的數(shù)據(jù)來源,如果有一張來源表出問題了,我們能夠快速準確地定位問題,并清楚的知道它的影響范圍。同時我們會制定每一層的調(diào)用規(guī)范:

  • 禁止反向調(diào)用
  • ODS層數(shù)據(jù)只能被DWD層調(diào)用
  • DWD層數(shù)據(jù)可以被DWS和ADS層調(diào)用
  • DWS層數(shù)據(jù)只能被ADS調(diào)用
  • 數(shù)據(jù)應用可以調(diào)用DWD、DWS和ADS層,但建議優(yōu)先考慮使用匯總度高的數(shù)據(jù)
  • 常規(guī)數(shù)據(jù)流向:ODS-DWD-DWS-ADS
3. 數(shù)據(jù)復用數(shù)據(jù)的逐層加工,下層包含了上層數(shù)據(jù)加工所需要的全量數(shù)據(jù),這樣的加工方式避免了每個數(shù)據(jù)開發(fā)人員都重新從源系統(tǒng)中抽取數(shù)據(jù)進行加工。通過匯總層的引入,面向不同主題的數(shù)據(jù)集市可以共用匯總層數(shù)據(jù),實現(xiàn)了計算結果的復用,節(jié)省了數(shù)據(jù)開發(fā)人員的時間和精力。

4. 復雜問題簡單化將一個復雜的任務分解成多個步驟完成,每一層只處理單一的步驟,比較簡單且容易理解,便于維護數(shù)據(jù)的準確性。當數(shù)據(jù)出現(xiàn)問題之后,可以不用修復所有的數(shù)據(jù),只需要從有問題的步驟開始修復。

5. 屏蔽原始數(shù)據(jù)異常對業(yè)務的影響數(shù)據(jù)倉庫對接的源系統(tǒng)眾多,且每個源系統(tǒng)的表命名、字段命名、字段含義等各有不同,通過數(shù)據(jù)倉庫的分層設計,從底層來規(guī)范和屏蔽所有這些復雜性,保證下游數(shù)據(jù)用戶使用數(shù)據(jù)的便捷和規(guī)范。如果源系統(tǒng)發(fā)生變更,只需要再相應的數(shù)據(jù)倉庫層來處理,對下游用戶透明,無感。

完 謝謝觀看