Kas yra duomenų saugyklos modelis?

Duomenų saugyklos modelis yra taikomoji kompiuterinės sistemos duomenų modelio forma. Kompiuterinėse sistemose duomenų srautas modeliuojamas remiantis teorine informacija, siekiant patikrinti sistemos galimybes ir apribojimus. Kai atsirado duomenų saugykla, tie patys modeliai pradėjo rasti faktinių fizinių pritaikymų kuriant duomenis. Tai būtų panašu į tai, kad žmogus paprasčiausiai atliktų matematikos uždavinius ir naudotų tas lygtis naujo tipo varikliui sukurti.

Yra keletas skirtingų duomenų saugyklos modelio idėjų. Kiekvienas iš jų turi savo stipriąsias ir silpnąsias puses, taip pat duomenų tipus, kuriuos jis labiau tinka tvarkyti. Neretai toje pačioje sistemoje egzistuoja keli skirtingi duomenų saugyklos modeliai arba hibridinės sistemos, kurios naudojasi kelių tipų pranašumais.

Plokščia sistema yra duomenų saugyklos modelio tipas, kurį daugelis vartotojų pripažintų kaip lengviausią. Šis duomenų saugojimo būdas apima tarpusavyje sujungtas informacijos eilutes ir stulpelius, panašius į skaičiuoklę. Nors šį metodą lengva perskaityti žmonėms, kompiuteriams jis yra sunkesnis ir lėtas koreliuoti.

Hierarchinis duomenų saugyklos modelis saugo informaciją ištisine lygių serija. Kiekviename lygyje yra informacija, kuri priklauso nuo anksčiau pateiktos kartos. Tai labai panašu į tinklo modelį, kuriame taip pat yra keletas priklausomų lygių. Skirtumas slypi jų priklausomybėse – hierarchinėje sistemoje kiekvienas duomenų blokas gali turėti tik vieną aukštesnį priklausomybės lygį, o tinklo modelyje jų gali būti tiek, kiek reikia. Abiem atvejais vienas informacijos blokas gali prisijungti prie kelių toliau esančių blokų.

Reliacinės duomenų saugyklos modelis yra plokščiosios sistemos variantas. Duomenys saugomi lentelėse, panašiai kaip ir plokščiojoje sistemoje, ir kiekvienai pagrindinei duomenų daliai suteikiamas unikalus identifikatorius. Šis identifikatorius keliauja kartu su duomenimis, užtikrindamas unikalumą. Pavyzdžiui, jei darbdavys turi du darbuotojus tuo pačiu vardu, jų identifikatorius vis tiek juos atskirtų sistemoje. Šis identifikatorius yra koreliuojamas visoje sistemoje – jei viskas veikia tinkamai, kiekvieną kartą, kai į sistemą patenka kas nors, kas susiję su unikalia informacija, jis koreliuotų su jau esama informacija, pagrįsta vien identifikatoriumi.

Dimensinis modelis yra pagrįstas hierarchiniu. Vienas faktas naudojamas kaip atskaitos taškas, tada iš jo nuteka papildoma su tuo faktu susijusi informacija. Toks elementas kaip darbuotojo numeris būtų pradinis faktas; tada su tuo darbuotoju susijusios datos, taip pat darbo užmokestis ar atostogų laikas būtų prisijungę prie jo, kai jie patenka į sistemą.
Reliacinis ir dimensinis duomenų saugyklos modeliai yra du dažniausiai naudojami stiliai. Yra ir kitų duomenų saugyklų tipų, tačiau jie yra nedideli, palyginti su šiais. Paprastai nauji modeliai kuriami iš plokščiųjų, hierarchinių arba tinklo sistemų; dažnai tai tik paprasti jų pagrindinio organizavimo metodo patobulinimai.