Kartais žinomas kaip informacijos gavimas, informacijos išgavimas (IE) yra procesas, naudojamas su kompiuterinėmis sistemomis, kad būtų galima išgauti atitinkamus duomenis iš didesnių duomenų rinkinių, naudojant tam tikrus iš anksto nustatytus kriterijus. Informacijos išgavimo idėja yra suteikti galimybę lengvai identifikuoti ir įsisavinti duomenis, susijusius su konkrečia veikla, nereikalaujant rankiniu būdu pereiti per didelius informacijos kiekius, norint rasti tikslius reikalingus duomenis. Šis procesas yra panašus į koncepcijos gavybos ar žiniatinklio grandymo idėjas, nes visais šiais metodais siekiama surinkti naudingą informaciją iš platesnio turimų duomenų.
Bendras požiūris į informacijos išgavimą reikalauja naudoti programavimą, galintį nuskaityti informacijos šaltinius, kurie laikomi mašininiu skaitomu. Tai gali būti popierinės kopijos dokumentai, nuskaityti į tam tikrus elektroninius failus, dokumentai, paruošti kaip skaičiuoklės ar teksto apdorojimo dokumentai, arba net duomenys, esantys skaitomuose duomenų bazės laukuose. Paprastai nustatomi parametrai, leidžiantys programinei įrangai suteikti prieigą prie šių duomenų šaltinių ir greitai juos nuskaityti pagal konkrečius kriterijus, kad būtų nustatytas prioritetas ir tam tikro tipo informacija būtų ištraukta iš turimo telkinio. Šis procesas paprastai skiriasi nuo paprastos paieškos proceso tuo, kad metodas reikalauja neatitikti konkrečių žodžių ar frazių per se, o vietoj to naudojamas procesas, vadinamas natūralios kalbos apdorojimu, kuris padeda įvertinti ne tik tikrus žodžius, bet ir kontekstą bei to konteksto suponuojama prasmė.
Dėl informacijos išgavimo sudėtingumo šio metodo naudojimas yra šiek tiek sunkiai valdomas pasauliniu mastu, nors yra IE įrankių, kurie labai gerai veikia tik su ribotu duomenų kiekiu, pvz., duomenų šaltiniai, susiję su elektroniniais failais, esančiais korporacijos serveris ar net šaltinių telkinys, apimantis ribotą skaičių naujienų. Taikant šį metodą galima identifikuoti tam tikro tipo įvykius, galbūt net apriboti grąžą iki tam tikro dalyvių skaičiaus įtraukimo į renginį ir suskirstyti duomenis pagal datą.
Kaip ir daugelio technologijų atveju, informacijai išgauti naudojami įrankiai nuolat tobulinami. Nuo XXI amžiaus pradžios labai išaugo galimybė nustatyti parametrus ir pasinaudoti vis didėjančiais elektroninių duomenų rinkiniais, kaip svarbios informacijos paieškos dalimi. Tai apima galimybę tvarkyti didelius nestruktūrizuotų duomenų kiekius ir naudoti tuos parametrus, kad duomenims būtų suteikta tvarka ar struktūra, todėl jie bus dar naudingesni atliekant būsimas paieškas.