Duomenų integravimas yra kelių duomenų šaltinių sujungimas į vieną duomenų šaltinį. Ši praktika dažnai užima daug laiko ir yra sudėtinga, nes skirtingi duomenų šaltiniai greičiausiai nesuderinami vienas su kitu. Tokių paprastų dalykų, kaip skirtingų stulpelių pavadinimų skaičiuoklėje, pakanka, kad reikėtų iš naujo suformatuoti datą. Šis procesas labiausiai paplitęs situacijose, kai dvi grupės pradėjo be ryšio, bet yra sujungiamos po to, kai dirba savarankiškai. Duomenų integravimas tapo svarbesne tema dėl nemokamų duomenų šaltinių ir internetinių duomenų bazių paplitimo.
Duomenų integravimo duomenų dalis gali būti beveik bet kokia, kol ji saugoma kompiuterinėje sistemoje. Tikrasis duomenų turinys retai būna toks svarbus kaip duomenų saugojimo būdas. Dažniausiai duomenys saugomi duomenų bazėse, organizuotose informacijos sistemose. Šiose sistemose yra unikalių įrašų ir laukų, kurie leidžia vartotojams greitai rasti informaciją.
Didžiausia bet kokio duomenų integravimo proceso kliūtis yra patys duomenys. Daugeliu atvejų pirmą kartą nustatant duomenis nebuvo ketinimo sujungti duomenų rinkinį su kitu. Tai reiškia, kad nors du duomenų rinkiniai gali nurodyti tą patį dalyką, jie yra visiškai nesuderinami.
Beveik dėl bet ko duomenų bazės bus nesuderinamos. Kad būtų išvengta lengvo susijungimo, gali pakakti tokio paprasto dalyko kaip pateikimo skirtumas, pvz., lauko tvarka ar stulpelių plotis. Kai duomenys labai skiriasi, pavyzdžiui, vienoje duomenų bazėje, kurioje yra daugiau ar mažiau informacijos, sujungimas yra daug sunkesnis.
Dvi situacijos, kuriose labiau nei bet kuri kita reikalauja duomenų integravimo, yra verslo ir tyrimų srityse. Verslo pasaulyje sujungiant padalinius ar įmones reikia sujungti anksčiau atskirtą informaciją į vieną struktūrą. Ši integravimo forma paprastai yra labai sudėtinga, nebent pradinės grupės naudojo panašią programinę įrangą ir turėjo panašių informacijos tikslų.
Kai duomenų integravimas atliekamas mokslinių tyrimų tikslais, jis paprastai vyksta daug sklandžiau. Kai vienas tyrėjas suteikia prieigą prie savo informacijos kitam, abi šalys paprastai tiria tą patį procesą. Tai reiškia, kad jie naudos panašius metodus savo duomenims kataloguoti ir saugoti.
Anksčiau duomenų integravimas buvo palyginti nedidelė duomenų tyrimų sritis, tačiau tai pasikeitė nuo XXI amžiaus pradžios. Nemokamos internetinės duomenų bazės tampa vis populiaresnės ir tikslesnės, todėl įmonės stengiasi gauti informaciją bendrinamu formatu. Tai leidžia jiems skelbti savo informaciją vieša forma ir integruoti privačias gerai žinomų viešųjų sąsajų versijas į savo sistemas.