Kokie yra skirtingi duomenų saugyklos dizaino tipai?

Duomenų saugyklose saugomi didžiuliai duomenų kiekiai, skirti naudoti įvairiose srityse. Yra du pagrindiniai duomenų saugyklos dizaino tipai: iš viršaus į apačią ir iš apačios į viršų. Abu dizainai turi savų privalumų ir trūkumų. „Iš apačios į viršų“ yra lengviau ir pigiau įgyvendinti, tačiau jis nėra toks išsamus, o duomenų koreliacijos yra labiau sporadiškos. Taikant „iš viršaus į apačią“ dizainą, ryšiai tarp duomenų yra akivaizdūs ir nusistovėję, tačiau duomenys gali būti pasenę, o sistemos įdiegimas yra brangus.

Duomenų rinkos yra pagrindinė duomenų saugyklos dizaino figūra. Duomenų rinka yra duomenų rinkinys, pagrįstas viena koncepcija. Kiekviena duomenų rinka yra unikalus ir pilnas duomenų poaibis. Kiekviena iš šių kolekcijų yra visiškai koreliuojama viduje ir dažnai turi sąsajų su išorinėmis duomenų rinkomis.

Duomenų rinkų tvarkymo būdas yra pagrindinis skirtumas tarp dviejų duomenų saugyklos dizaino stilių. Taikant „iš viršaus į apačią“ dizainą, duomenų srautai atsiranda natūraliai, kai duomenys įvedami į sistemą. „Iš apačios į viršų“ dizaino duomenų rinkiniai gaminami tiesiogiai ir sujungiami, kad sudarytų sandėlį. Nors tai gali atrodyti nereikšmingas skirtumas, jis sukuria labai skirtingą dizainą.

„Iš viršaus į apačią“ metodas buvo pradinis duomenų saugyklos dizainas. Naudojant šį metodą, visa organizacijos turima informacija įvedama į sistemą. Kiekviena plati tema turės savo bendrą sritį duomenų bazėse. Naudojant duomenis, atsiras ryšiai tarp koreliacinių duomenų taškų ir atsiras duomenų rinkiniai. Be to, bet kokie sistemoje esantys duomenys lieka ten amžinai – net jei vėliau informacija juos pakeičia arba sumenkina, jie liks sistemoje kaip praeities įvykių įrašas.

Duomenų saugyklos projektavimo metodas iš apačios į viršų veikia priešinga kryptimi. Įmonė pateikia informaciją kaip atskirą duomenų rinką. Laikui bėgant į sistemą pridedami kiti duomenų rinkiniai arba kaip atskiri duomenų rinkiniai, arba kaip jau esančios duomenų rinkiniai. Kai manoma, kad dvi duomenų rinkos yra pakankamai sujungtos, jos susilieja į vieną vienetą.
Abi duomenų saugyklos konstrukcijos turi savo stipriąsias ir silpnąsias puses. „Iš viršaus į apačią“ metodas yra didžiulis projektas, skirtas dar mažesniems duomenų rinkiniams. Kadangi dideli projektai kainuoja ir brangiau, tai brangiausia pinigų ir darbo jėgos atžvilgiu. Jei duomenų saugykla yra baigta ir prižiūrima, tai yra didžiulė kolekcija, kurioje yra viskas, ką įmonė žino.
„Iš apačios į viršų“ procesas yra daug greitesnis ir pigesnis, tačiau kadangi duomenys įvedami pagal poreikį, duomenų bazė niekada nebus baigta. Be to, koreliacijos tarp duomenų rinkų yra tiek stiprios, kiek jas padaro jų naudojimas. Jei egzistuoja tvirta koreliacija, bet joks naudotojas jos nemato, ji neatsiejama.