Duomenų saugyklos gavyba – tai vienoje ar keliose duomenų bazėse esančios informacijos analizė, siekiant, kad informacija būtų naudinga. Šios duomenų bazės arba duomenų saugyklos yra centrinė duomenų saugykla. Įmonės kaupia informaciją apie savo klientus duomenų saugykloje. Surinkus informaciją, ji „išgaunama“ ir iš jos išgaunama naudinga informacija, kuri gali padėti įmonei priimti verslo sprendimus, kurie padidins pelną arba sumažins išlaidas. Mažmenininkai dažnai naudoja duomenų saugyklos gavybą, kad analizuotų ir prognozuotų savo klientų elgesį.
Pavyzdžiui, kai pirkėja nueina į prekybos centrą ir kasininkei paduoda savo dažno pirkėjo kortelę, informacija apie jos pirkinius surenkama ir saugoma įmonės duomenų saugykloje. Prekybos centrų tinklas turės milijonus duomenų apie tai, ką žmonės perka, kada, kokiais kiekiais ir kokia kaina. Parduotuvė gali žinoti, kad pernai buvo parduota 50,000 75 pakuočių šaldytų žirnių, tačiau vien ta informacija nėra itin naudinga. Tačiau jei duomenų saugyklos gavybos metu paaiškės, kad 10% šaldytų žirnių buvo parduoti tais mėnesiais, kai šviežių žirnių nebuvo, arba kad XNUMX% žirnių buvo parduoti per dvi savaites iki Padėkos dienos, įmonė gali pasinaudoti šia informacija, kad padidintų metinius šaldytų žirnių pardavimus.
Įmonės gali naudoti duomenų saugyklos gavybos metodus, kad prognozuotų būsimą pardavimą. Duomenų gavyba taip pat gali padėti jiems įvertinti atsargų ir kainų sprendimų poveikį. Prekybos centre duomenų gavyba gali neleisti parduotuvėse pritrūkti šaldytų žirnelių, jei tam tikrais metais būtų prastas šviežių žirnių derlius.
Duomenų gavybos regresija yra duomenų gavybos metodas, naudojamas norint parodyti, kas gali nutikti duomenų vertei, jei kažkas lygtyje pasikeis. Remiantis prekybos centro pavyzdžiu, regresija numatytų šaldytų žirnių pardavimo lygį, jei pabrangtų švieži. Regresija naudoja istorinius duomenis ir jiems pritaiko formulę, kuri numato būsimą elgesį.
Įmonės dažnai naudoja duomenų saugyklos gavybos programinę įrangą savo duomenims rinkti ir išgauti. Tinkamą taikymą lemia turimų duomenų kiekis ir norimos atlikti analizės tipas. Norint rinkti ir interpretuoti naudingus duomenis, labai svarbu pasirinkti tinkamą duomenų gavybos įrankį.