午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

CDA數(shù)據(jù)分析師

CDA數(shù)據(jù)分析師

考試報(bào)名
考試報(bào)名
考試內(nèi)容
考試大綱
在線客服
返回頂部

為什么要對數(shù)據(jù)倉庫進(jìn)行分層設(shè)計(jì)?

2024-01-03

(以下文章來源于大飛談技術(shù) ,作者常大飛)

為了清晰數(shù)據(jù)結(jié)構(gòu),方便數(shù)據(jù)血緣跟蹤,減少重復(fù)開發(fā),簡化復(fù)雜問題,屏蔽原始數(shù)據(jù)的異常與業(yè)務(wù)的影響,在設(shè)計(jì)數(shù)據(jù)倉庫體系時通常需要對其邏輯分層。

1. 清晰數(shù)據(jù)結(jié)構(gòu)一般我們將數(shù)據(jù)倉庫分為ODS層(原始數(shù)據(jù)層)、DWD層(明細(xì)數(shù)據(jù)層)、DWS層(數(shù)據(jù)匯總層)和ADS層(數(shù)據(jù)應(yīng)用層)。每一個分層都有它自己的作用域,并且我們在設(shè)計(jì)數(shù)據(jù)倉庫時會為每個分層的表設(shè)置各自的命名規(guī)范,這樣我們在使用表的時候能更方便的定位和理解數(shù)據(jù)。另外,數(shù)據(jù)倉庫的數(shù)據(jù)是來源于不同的業(yè)務(wù)系統(tǒng),比如客戶信息同時存在于CRM系統(tǒng)、訂單系統(tǒng)、營銷系統(tǒng)等,取數(shù)時該如何決策呢?數(shù)據(jù)倉庫會對相同主題的數(shù)據(jù)進(jìn)行統(tǒng)一建模,把復(fù)雜的數(shù)據(jù)關(guān)系梳理成條理清晰的數(shù)據(jù)模型。

2. 數(shù)據(jù)血緣跟蹤通過數(shù)據(jù)倉庫中的邏輯分層,確定每一層的數(shù)據(jù)來源,如果有一張來源表出問題了,我們能夠快速準(zhǔn)確地定位問題,并清楚的知道它的影響范圍。同時我們會制定每一層的調(diào)用規(guī)范:

  • 禁止反向調(diào)用
  • ODS層數(shù)據(jù)只能被DWD層調(diào)用
  • DWD層數(shù)據(jù)可以被DWS和ADS層調(diào)用
  • DWS層數(shù)據(jù)只能被ADS調(diào)用
  • 數(shù)據(jù)應(yīng)用可以調(diào)用DWD、DWS和ADS層,但建議優(yōu)先考慮使用匯總度高的數(shù)據(jù)
  • 常規(guī)數(shù)據(jù)流向:ODS-DWD-DWS-ADS
3. 數(shù)據(jù)復(fù)用數(shù)據(jù)的逐層加工,下層包含了上層數(shù)據(jù)加工所需要的全量數(shù)據(jù),這樣的加工方式避免了每個數(shù)據(jù)開發(fā)人員都重新從源系統(tǒng)中抽取數(shù)據(jù)進(jìn)行加工。通過匯總層的引入,面向不同主題的數(shù)據(jù)集市可以共用匯總層數(shù)據(jù),實(shí)現(xiàn)了計(jì)算結(jié)果的復(fù)用,節(jié)省了數(shù)據(jù)開發(fā)人員的時間和精力。

4. 復(fù)雜問題簡單化將一個復(fù)雜的任務(wù)分解成多個步驟完成,每一層只處理單一的步驟,比較簡單且容易理解,便于維護(hù)數(shù)據(jù)的準(zhǔn)確性。當(dāng)數(shù)據(jù)出現(xiàn)問題之后,可以不用修復(fù)所有的數(shù)據(jù),只需要從有問題的步驟開始修復(fù)。

5. 屏蔽原始數(shù)據(jù)異常對業(yè)務(wù)的影響數(shù)據(jù)倉庫對接的源系統(tǒng)眾多,且每個源系統(tǒng)的表命名、字段命名、字段含義等各有不同,通過數(shù)據(jù)倉庫的分層設(shè)計(jì),從底層來規(guī)范和屏蔽所有這些復(fù)雜性,保證下游數(shù)據(jù)用戶使用數(shù)據(jù)的便捷和規(guī)范。如果源系統(tǒng)發(fā)生變更,只需要再相應(yīng)的數(shù)據(jù)倉庫層來處理,對下游用戶透明,無感。

完 謝謝觀看