Kas yra duomenų dubliavimas?

Duomenų dubliavimo panaikinimas yra duomenų glaudinimo metodas, kai ištrinami pasikartojantys duomenys, išlaikant vieną kiekvieno informacijos vieneto kopiją sistemoje, o ne leidžiant klestėti keliems. Išsaugotos kopijos turi nuorodas, leidžiančias sistemai jas nuskaityti. Ši technika sumažina saugyklos vietos poreikį ir gali užtikrinti, kad sistemos veiktų greičiau, be to, apribotos su duomenų saugojimu susijusios išlaidos. Jis gali veikti įvairiais būdais ir yra naudojamas daugelio tipų kompiuterinėse sistemose.

Duomenų dubliavimo failo lygiu metu sistema ieško bet kokių pasikartojančių failų ir ištrina priedus. Blokų lygio deduplikacija žiūri į duomenų blokus failuose, kad nustatytų pašalinius duomenis. Žmonės gali gauti dvigubus duomenis dėl įvairių priežasčių, o naudojant duomenų deduplikaciją galima supaprastinti sistemą, kad ja būtų lengviau naudotis. Sistema gali periodiškai peržiūrėti duomenis, kad patikrintų, ar nėra dublikatų, pašalintų priedus ir generuotų nuorodas į paliktus failus.

Tokios sistemos kartais vadinamos išmaniosiomis glaudinimo sistemomis arba vieno egzemplioriaus saugojimo sistemomis. Abu terminai nurodo idėją, kad sistema išmaniai saugo ir saugo duomenis, kad sumažintų sistemos apkrovą. Duomenų dubliavimo panaikinimas gali būti ypač vertingas didelėse sistemose, kuriose saugomi duomenys iš daugelio šaltinių, o saugojimo išlaidos nuolat auga, nes laikui bėgant sistemą reikia plėsti.

Šios sistemos sukurtos taip, kad būtų didesnės duomenų glaudinimo ir valdymo sistemos dalis. Duomenų pasidubliavimas negali apsaugoti sistemų nuo virusų ir gedimų, todėl svarbu naudoti tinkamą antivirusinę apsaugą, kad sistema būtų saugi ir apribotų failų užteršimą virusais, o atsarginės kopijos būtų kuriamos atskiroje vietoje, kad būtų galima išspręsti susirūpinimą dėl duomenų praradimo dėl gedimų, sugadinimo įranga ir pan. Duomenų suglaudinimas prieš darant atsarginę kopiją sutaupys laiko ir pinigų.

Sistemos, naudojančios duomenų dubliavimą savo saugykloje, gali veikti greičiau ir efektyviau. Jas vis tiek reikės periodiškai plėsti, kad būtų galima įtraukti naujus duomenis ir išspręsti susirūpinimą dėl saugumo, tačiau jie turėtų būti mažiau linkę greitai pasipildyti pasikartojančiais duomenimis. Tai ypač dažna problema el. pašto serveriuose, kur serveris gali saugoti didelius vartotojų duomenų kiekius, o didelę jų dalį gali sudaryti dublikatai, pavyzdžiui, tie patys priedai, pasikartojantys nuolat. pavyzdžiui, daugelis žmonių, siunčiančių el. laiškus iš darbo, prisegė poraštes su el. laiškų atsisakymais ir įmonės logotipais, o tai gali greitai užimti serverio vietą.