Duomenų analizė reiškia didelių neapdorotų arba nesutvarkytų duomenų kiekių peržiūros procesą, kad iš duomenų būtų galima suformuluoti išvadas. Jis dažnai naudojamas versle, siekiant sukurti veiksmų planus arba nustatyti verslo modelius ir tendencijas bei padėti įmonėms geriau suprasti klientų elgesį. Ją taip pat naudoja daugelio disciplinų ekonomistai ir akademiniai specialistai, kad padėtų formuluoti, paremti ar paneigti teorijas.
Daugeliu atvejų renkami dideli duomenų kiekiai, kuriuos reikia ištirti. Pavyzdžiui, ekonomistai gali gauti tūkstančius apklausų atsakymų arba peržiūrėti begalę vyriausybės ir surašymo duomenų apie didžiules gyventojų dalis. Kiti akademikai taip pat gali gauti daugybę didelių neorganizuotos informacijos; Pavyzdžiui, mokslininkas, tiriantis galimą vėžio gydymo būdą, gali gauti šimtų ar net tūkstančių ar milijonų pacientų tyrimų rezultatus. Versle duomenys taip pat gali būti renkami pardavimo duomenų, klientų kvitų, operacijų ar kitos rūšies informacijos forma.
Visi šie duomenys suteikia informacijos ir greičiausiai juose yra modelių ir tendencijų, kurios gali padėti formuoti ir valdyti elgesį. Tačiau norint naudoti informaciją, duomenys turi būti sutvarkyti, išanalizuoti ir suprasti. Duomenų analizė reiškia visų tų duomenų organizavimo ir analizės procesą.
Kaip yra daug skirtingų duomenų tipų ir šaltinių, taip pat yra daug skirtingų analizės metodų. Kai kurie duomenys turi būti tvarkomi rankiniu būdu ir užkoduoti ranka. Kitos didelės informacijos duomenų bazės gali būti sijojamos naudojant specializuotas kompiuterines programas, kurios supaprastina ir supaprastina duomenų analizės procesą.
Duomenų analizės procesas ir procedūra priklauso ne tik nuo to, kaip duomenys sutvarkyti, bet ir nuo to, ko žmogus ieško. Pavyzdžiui, ekonomistas gali peržiūrėti duomenis, kad surastų pirkimo ar išlaidų modelius, paaiškinančius elgesį. Įmonė gali peržiūrėti duomenis, kad nustatytų klientų tiekimo grandinės trūkumus arba konkrečiam darbuotojui kylančias problemas.
Kiekviena įmonė paprastai kuria savo duomenų analizės metodus, leidžiančius išspręsti konkrečios įmonės problemas. Pavyzdžiui, sveikatos draudimo bendrovė gali turėti milijonų išmokėtų išmokų duomenų bazę. Darbuotojai, atsakingi už duomenų analizę, būtų atsakingi už galimų sutrikimų aptikimo algoritmų generavimą ir vykdymą. Taigi kompiuterinė programa ir algoritmai galėtų būti paleisti siekiant nustatyti sritis, kuriose galėjo būti išmokėti melagingi reikalavimai, kuriuos reikėtų ištirti.