關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
構(gòu)建數(shù)據(jù)湖倉(cāng) 在數(shù)據(jù)湖倉(cāng)的所有新增要素中,排名第一的就是可以利于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)所用的分析基礎(chǔ)設(shè)施。分析基礎(chǔ)設(shè)施包括一眾大家廣為熟悉的東西,當(dāng)然也包括一些可能對(duì)大家還有些陌生或略帶新鮮感的概念。比如包括:元數(shù)據(jù)、數(shù)據(jù)血緣、 數(shù)據(jù)體量的度量 、數(shù)據(jù)創(chuàng)建的歷史記錄、數(shù)據(jù)轉(zhuǎn)換描述。 數(shù)據(jù)湖倉(cāng)的第二個(gè)新增要素,是識(shí)別和使用通用連接器。通用連接器允許合并和比較所有不同來(lái)源的數(shù)據(jù)。如果沒(méi)有通用連接器,就很難(實(shí)際上是幾乎不可能)將數(shù)據(jù)湖倉(cāng)中的不同數(shù)據(jù)關(guān)聯(lián)起來(lái)。但有了這個(gè)中西,就可以關(guān)聯(lián)任何類(lèi)型的數(shù)據(jù)。 使用數(shù)據(jù)湖倉(cāng),就有可能實(shí)現(xiàn)以往任何其它方式都不可行或不可能實(shí)現(xiàn)的某種程度的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。 但與其它架構(gòu)一樣,我們需要理解數(shù)據(jù)湖倉(cāng)的架構(gòu)以及它的能力,以便于我們基于這種架構(gòu)創(chuàng)建數(shù)據(jù)分析藍(lán)圖和開(kāi)展數(shù)據(jù)分析規(guī)劃。
你還可能感興趣
我要評(píng)論
|