Ryšių su klientais valdymo (CRM) duomenų gavyba reiškia paieškos ryšių su klientais duomenų bazėse procesą ir surinktų duomenų apie klientų elgesį analizavimą. Šie duomenys padeda rinkodaros specialistams geriau sutelkti savo kampanijas, o tai padidina klientų išlaikymą ir pardavimą. CRM duomenų gavyba taip pat žinoma kaip duomenų tyrinėjimas ir žinių atradimas. Yra dvi pagrindinės kategorijos, susijusios su duomenų gavyba: aprašomoji analizė ir nuspėjamasis modeliavimas.
Aprašomojoje analizėje naudojamas segmentavimas ir grupavimas, kad būtų galima geriau išanalizuoti tam tikros klientų grupės elgesio modelį. Klientus galima grupuoti pagal lytį, amžių, rasę ir kitas kategorijas. Pagrindinis segmento tikslas yra suteikti rinkodaros specialistui panašių klientų grupę, kad būtų galima efektyviau išgauti duomenis ir gauti naudingų įžvalgų.
Klasterizavimas sujungia segmentų grupes. Kiekvienas klasteris yra vienas kitą paneigiantis ir jam būdingas iš anksto nustatytų charakteristikų rinkinys. Pavyzdžiui, į klasterį galėtų būti įtrauktos 18–25 metų moterys, įsigijusios tam tikrą nagų laką per paskutines dvi 2010 m. gruodžio savaites. Tai kokybinio CRM duomenų gavybos metodo pavyzdys.
Neišskiriamuose segmentuose, kita aprašomosios analizės forma, tam tikras klientų elgesio rinkinys lemia visiškai naują elgesio rinkinį. Pavyzdžiui, klientų grupė gali išleisti didelę pinigų sumą SPA paslaugoms, bet neišleisti daug pinigų susijusioms paslaugoms, tokioms kaip plaukų ir salonų priežiūra. Šio tipo CRM duomenų gavybai reikalinga pažangesnė statistinė analizė nei pagrindinis segmentavimas.
Nuspėjamasis modeliavimas yra populiaresnis iš dviejų CRM duomenų gavybos kategorijų. Jis matuoja koreliacijos tarp dviejų klientų elgsenos veiksnių laipsnį ir tos koreliacijos statistinį patikimumą. Nuspėjamasis modelis sukurtas naudojant duomenų gavybos programą, kuri kiekvienam klientui priskiria balus, nurodančius tikimybę, kad klientas elgsis taip pat ir ateityje. Pavyzdžiui, modelis gali padėti rinkodaros specialistui nustatyti tikimybę, kad 31–42 metų vedęs klientas, turintis vaikų, per ateinančius šešis mėnesius nusipirks tam tikros markės vejapjovę.
Specifiškumas yra labai svarbus CRM duomenų gavybai naudojant nuspėjamuosius modelius. Šiuo tikslu naudojami kelių tipų metodai. Vienakryptis modelis palygina vieną kintamąjį su keliais kitais kintamaisiais, kad nustatytų ryšį su didžiausia koreliacija. Chi kvadrato automatinės sąveikos aptikimo analizė (CHAID) ir klasifikavimo bei regresijos medžių (CART) modeliai rodo sprendimų medžius, kai vienas kintamasis sukelia vieno ar kelių kintamųjų atvejį. Daugiamatės regresijos modelis išbando kelis kintamuosius vienas prieš kitą, kad įvertintų galimas koreliacijas.