2022-02-22
CDA數(shù)據(jù)分析師 出品
編輯:Mika
數(shù)據(jù)倉庫是商業(yè)和數(shù)據(jù)科學中最熱門的話題之一。
但是,如果你是該領(lǐng)域的新手,你可能想知道:
好的,首先讓我們看到定義。
單一數(shù)據(jù)源是什么意思。
在信息系統(tǒng)理論中,單一數(shù)據(jù)源是在一個地方構(gòu)造全部最佳質(zhì)量數(shù)據(jù)的實踐。
讓我們看到一個簡單的例子。
你肯定遇到過這種情況,當你在處理文件,并且創(chuàng)建不同的版本,這時你怎么給文件命名?
當你完成后,你通常會在結(jié)尾加上"最終版"。這導(dǎo)致一堆帶有擴展名的文件,比如,"最終.最終 最終.最終.最終”,或者是我的最愛——"真正最終版最終版"
如果你是這樣,那你不是一個人。
看來即使是公司,也可能永遠都不知道最新或最合適的文件在哪里。
但是如果你知道有個地方,會始終擁有單一的數(shù)據(jù)源,這就太有幫助了,不是么?
數(shù)據(jù)倉庫就可以滿足這種需求。
那么到底什么是數(shù)據(jù)倉庫呢?
指的就是公司存儲其寶貴數(shù)據(jù)資產(chǎn)的地方。當中包括客戶數(shù)據(jù)、銷售數(shù)據(jù)、員工數(shù)據(jù)等。
簡而言之,數(shù)據(jù)倉庫是公司事實上的單一數(shù)據(jù)源。通常創(chuàng)建它是為了將其主要用于數(shù)據(jù)報告和分析目的。
數(shù)據(jù)倉庫有幾個定義特征,即 :
讓我們快速地分別看看。
這意味著數(shù)據(jù)倉庫中的信息會圍繞某些方面。因此,它永遠不會包含所有公司數(shù)據(jù),不只會包含相關(guān)的主題。
例如,競爭對手的數(shù)據(jù)不需要出現(xiàn)在數(shù)據(jù)倉庫中。但是,自己的銷售數(shù)據(jù)肯定會在。
對應(yīng)于開頭的例子,在命名方面,每個數(shù)據(jù)庫、每個團隊,甚至每個人都有自己的偏好。
這就是為什么要開發(fā)通用標準,以確保數(shù)據(jù)倉庫在任何方面都能選擇最佳質(zhì)量的數(shù)據(jù)。這與主數(shù)據(jù)治理有關(guān),但這是另一個話題了。
與以下事實有關(guān),數(shù)據(jù)倉庫也包含歷史數(shù)據(jù)。
如前所述,我們主要使用數(shù)據(jù)倉庫進行分析和報告。這意味著我們需要知道五到十年前發(fā)生的事情。
意味著數(shù)據(jù)僅按原樣錄入數(shù)據(jù)倉庫。一旦存入,就無法更改或刪除。
這里再次涉及到將數(shù)據(jù)用于數(shù)據(jù)分析這一事實。通常,它會以某種方式進行匯總或細分,為了便于分析和報告。
好的,以上就是關(guān)于數(shù)據(jù)倉庫的介紹了。謝謝收看,祝好運。
完 謝謝觀看
CDA認證
關(guān)于CDA考試 最新考試安排 考試報名入口 CDA證書查詢CDA合作
CDA教育 Pearson CVA協(xié)會 電子工業(yè)出版社關(guān)注CDA
關(guān)于我們 Email:exam@cdaglobal.com 電 話:010-68454276 微 信:15311595173