Pagalvokite apie tai kaip apie jūsų duomenų namų valymą. ETL reiškia ekstraktas, transformavimas ir įkėlimas. ETL yra programinė įranga, leidžianti įmonėms konsoliduoti skirtingus duomenis, perkeliant juos iš vienos vietos į kitą, ir nesvarbu, kad tie duomenys yra skirtingų formų ar formatų. Duomenys gali būti gaunami iš bet kurio šaltinio. ETL yra pakankamai galingas, kad galėtų valdyti tokius duomenų skirtumus.
Pavyzdžiui, finansų įstaiga gali turėti informacijos apie klientą keliuose skyriuose ir kiekviename skyriuje to kliento informacija gali būti pateikta skirtingai. Narystės skyrius gali nurodyti klientą pagal pavadinimą, o apskaitos skyrius gali nurodyti klientą pagal numerį. ETL gali sujungti visus šiuos duomenis ir sujungti juos į vienodą pateikimą, pavyzdžiui, saugoti duomenų bazėje arba duomenų saugykloje.
Kitas būdas, kuriuo įmonės naudoja ETL, yra visam laikui perkelti informaciją į kitą programą. Pavyzdžiui, teksto apdorojimo duomenys gali būti išversti į skaičius ir raides, kuriuos lengviau sekti skaičiuoklėje arba duomenų bazės programoje. Tai ypač naudinga kuriant atsarginę informacijos kopiją, kai įmonės visiškai pereina prie naujos programinės įrangos.
Viena iš svarbių ETL funkcijų yra duomenų „valymas“. ETL konsolidavimo protokolai taip pat apima pasikartojančių arba fragmentinių duomenų pašalinimą, kad tai, kas pereina iš E proceso dalies į L dalį, būtų lengviau įsisavinama ir (arba) saugoma. Tokios valymo operacijos taip pat gali apimti tam tikrų duomenų pašalinimą iš proceso. Jei nenorite įtraukti tam tikros informacijos, galite tinkinti savo ETL, kad pašalintumėte tokią informaciją iš transformacijos.
Žinoma, lygties T dalis yra pati galingiausia. ETL gali transformuoti ne tik duomenis iš skirtingų padalinių, bet ir duomenis iš skirtingų šaltinių. Pavyzdžiui, duomenys el. pašto programoje, pvz., „Microsoft Outlook“, gali būti transformuojami kartu su duomenimis iš SAP gamybos programos, o galiausiai gaunami bendros gijos duomenys. „Microsoft“, žinoma, gamina ETL paketą, kaip ir „Oracle“ ir „IBM“.