Duomenų perteklius – tai situacija, atsirandanti duomenų bazių sistemose ir susijusi su netyčiniu pasikartojančių duomenų kūrimu, kuris nėra būtinas duomenų bazės funkcijai. Nors kai kuriose situacijose perteklius dažnai yra pageidautinas bruožas, tai netiesa, kai kalbama apie duomenų bazės funkciją. Pasikartojančių duomenų buvimas dažnai gali turėti neigiamą poveikį sistemos funkcijoms, todėl atsakant į sistemos užklausas pateikiama informacija, kuri nėra naudinga. Viena iš pagrindinių duomenų tvarkymo funkcijų yra pasikartojančių duomenų identifikavimas ir tų pasikartojančių duomenų pašalinimas.
Duomenų pertekliaus potencialas yra beveik bet kokio tipo duomenų bazės programose. Programos, kurios laikomos vientisomis, pvz., skaičiuoklės, ir kurios remiasi rankiniu duomenų įvedimu, yra ypač jautrios informacijos dubliavimui, dėl kurio gali kilti komplikacijų, kai reikia gauti pageidaujamą informaciją. Reliacinio stiliaus duomenų bazės, pvz., pardavimo kontaktų duomenų bazės, dažnai apima procesus, kurie padeda sumažinti netyčinio dubliavimosi tikimybę, pvz., dviejų skirtingų kontaktų failų sukūrimas tame pačiame kontakte, susietame su ta pačia įmone. Net naudojant sistemos patikras, padedančias sumažinti duomenų pertekliaus dažnį, vis tiek gali kilti problemų, todėl būtina periodiškai atlikti duomenų valymo duomenų bazėje užduotį.
Geriausiu atveju duomenų perteklius reiškia, kad duomenų bazėje gausu informacijos, kuri nėra esminė, bet nekelia jokios realios grėsmės galimybei rasti duomenis tada, kai reikia. Blogiausiu atveju pasikartojančių duomenų buvimas sulėtina esmines duomenų bazės funkcijas ir gali apsunkinti duomenų bazės naudojimą tam tikroms užduotims valdyti. Pavyzdžiui, naudojant klientų duomenų bazę, kuri yra užkimšta pertekline informacija, pašto etiketėms generuoti, būtų sukurta daug pasikartojančių lygių, todėl prieš naudojant etiketes reikės rūšiuoti ir išmesti dublikatus, arba imtis laikas išvalyti duomenų bazę prieš bandant generuoti etiketes.
Laimei, duomenų pertekliaus stebėjimas ir taisymas yra tai, ką daugelis duomenų valdymo sistemų gali atlikti gana lengvai. Kai kurios sistemos pažymės pasikartojančių duomenų įvestį, todėl bus lengva peržiūrėti pastebėtą dubliavimą ir nuspręsti, ar jį ištrinti, ar leisti palikti. Yra net programinės įrangos programų, kurias galima naudoti norint nuskaityti esamą duomenų bazę, ar nėra pasikartojančių duomenų, ir gana lengvai automatiškai pašalinti tuos perteklinius įrašus.