Kas yra duomenų saugyklos architektūra?

Duomenų saugyklos architektūra yra dizainas, apimantis visus įmonės aplinkos duomenų saugyklos aspektus. Duomenų saugykla – tai centrinio domeno sukūrimas sudėtingiems, decentralizuotiems įmonės duomenims saugoti loginiame vienete, kuris leidžia gauti duomenų, verslo žvalgybos ir bendrą prieigą prie visų svarbių organizacijos duomenų. Duomenų saugyklos architektūra apima visus ataskaitų teikimo, duomenų valdymo, saugos, dažnių juostos pločio ir saugojimo reikalavimus.

Kuriant duomenų saugyklos architektūrą svarbu suskaidyti architektūrą į konkrečias sritis, kurios yra sujungtos į holistinį galutinį dizainą. Šis dizainas turėtų būti laikomas įmonės duomenų architektūros modeliu. Visų pirma, svarstant duomenų saugyklos architektūrą turėtų būti išplėtotos kelios pagrindinės sritys. Šios sritys yra šaltinio sistemos prieiga, sustojimo srities procesas, duomenų praturtinimo procesas, duomenų architektūra, verslo žvalgybos procesas ir saugojimo reikalavimai.

Duomenų saugykla reikalauja, kad šaltinio duomenys būtų perkelti iš operacijų arba įrašų duomenų bazės į duomenų saugyklą. Šis procesas yra supaprastintas į terminą Extract Transform and Load (ETL), kuris iš esmės apima šaltinio sistemos prieigos, duomenų praturtinimo ir duomenų architektūros sritis. Aiškumo dėlei geriau šias architektūrines zonas suprojektuoti detaliai, nurodant, kaip bus pasiektas ETL procesas. Nors kai kurie duomenys reikalingi iš šaltinio sistemų, visi duomenys yra nepageidautini, nes jie pernelyg apkrautų įmonės sandėlį. Svarbiausios sritys sprendžiant šaltinio sistemos sluoksnį yra prieigos prie duomenų metodikos, iš šaltinio sistemos reikalingi duomenys ir atnaujinimo reikalavimai.

Kitas duomenų saugojimo architektūrinis sluoksnis, į kurį reikia atsižvelgti, yra sustojimo srities procesas. Kadangi daugumą duomenų iš šaltinio sistemų reikės patvirtinti ir išvalyti, prieš įkeliant į duomenų saugyklos verslo taisyklių sluoksnį svarbu sukurti nukreipimo zoną, kurioje šaltinio duomenys būtų saugomi. Sustojimo sritis palaiko neapdorotų duomenų sklaidos kanalus iš šaltinio sistemų, kurios paprastai yra laiko žymomis, kad būtų užtikrintas duomenų naujausiumas.

Duomenų praturtinimo arba verslo taisyklių procese duomenys išvalomi, kad būtų pasiektas norimas duomenų saugyklos rezultatas. Puikus šio valymo metodo pavyzdys yra adreso valymo priemonių naudojimas; Tuo atveju, jei šaltinio sistemoje yra neteisingų duomenų, duomenų praturtinimo procesas paleis adresą iš neapdorotų duomenų rinkinio į verslo taisyklių sistemą, kuri ištaisytų neteisingus adresus. Tai taip pat laikas, kai netikslūs duomenys ištrinami arba modifikuojami, siekiant užtikrinti duomenų saugyklos išsamumą.
Kitas sluoksnis, į kurį reikia atsižvelgti, yra duomenų architektūros sluoksnis. Šioje srityje užbaigiamas tikrasis įmonės duomenų saugyklos dizainas arba schema. Duomenų saugojimas nėra visų įmonės duomenų rinkinių derinys, o naujai apibrėžta duomenų bazė, sukurta taip, kad būtų galima peržiūrėti visus įmonės verslo subjektus.
Tam reikia, kad duomenų architektūra atsakytų į klausimus, kuriuos verslas užduos verslo žvalgybos ir duomenų gavybos srityje. Tokiu būdu sukuriant duomenų architektūrą, neapdorotų duomenų rinkiniai bus transformuojami į faktų lenteles, kurios leis vartotojams teikti ad hoc ataskaitas visame įmonės rodinyje, o ne konkrečioje duomenų bazėje. Tai taip pat sritis, kurioje bus saugomi metaduomenys apie neapdorotos sistemos duomenis, kurie gali apimti šaltinio sistemos pavadinimą arba pirminius raktus.
Kita sritis, į kurią reikia atsižvelgti, yra verslo žvalgybos ir ataskaitų teikimo reikalavimai. Šis sluoksnis gali būti laikomas vartotojo reikalavimu duomenų saugykloje. Paprastai šioje srityje yra paruoštų ataskaitų, ad hoc ataskaitų teikimo galimybė ir įmonės informacijos lentos arba įspėjimai. Verslo žvalgybos sluoksniams paprastai skiriama daugiausia dėmesio, nes tai yra vienintelis į išorę nukreiptas komponentas duomenų saugykloje.
Paskutinis sluoksnis, į kurį reikia atsižvelgti, yra bendri duomenų saugojimo reikalavimai ir priežiūra. Duomenų saugyklai toliau augant ir plečiantis, vartotojų bazės duomenų saugykla turi būti griežtai valdoma ir prižiūrima. Be to, kuriant duomenų saugyklos architektūrą, projekte turėtų būti realiai įvertinama, ko reikės duomenų saugojimo talpai, taip pat juostai su duomenų prieigos pajėgumais. Šie reikalavimai bus labai svarbūs, nes duomenų saugykla bus plačiai naudojama visoje įmonėje.