Kas yra kontroliuojamas žodynas?

Kontroliuojamas žodynas yra kompiuterių mokslo ir kompiuterių programavimo sąvoka, kuri apima tik iš anksto sutartų ar patvirtintų terminų naudojimą kuriant reliacines duomenų bazes, ieškomus metaduomenis ar kitas sistemas, kuriose žmonėms skaitomi žodžiai naudojami informacijai pažymėti, kad vėliau būtų galima gauti. Kontroliuojamo žodyno naudojimo informacijai klasifikuoti metodika tiesiogiai prieštarauja natūralios kalbos žodyno koncepcijai, kurioje nėra sutartų terminų, o visi vartojami žodžiai yra susieti svertiniais ryšiais. Be aukščiausio lygio žodžių, kurie naudojami kontroliuojamame žodyne, gali būti naudojami pagalbiniai žodžiai, todėl sinonimai ar kiti terminai, kurie yra stipriai susiję su aukščiausio lygio terminu, gali paskatinti aukščiausio lygio žodžio vartojimą. Pagrindiniai skirtumai, kurie išmatuojami tarp natūralios kalbos sistemų ir valdomų žodynų sistemų, yra užklausos naudojant žodžius rezultatų tinkamumas, grąžinamos informacijos kiekis ir bendras sistemos tinkamumas naudoti.

Yra daug atvejų, kai žodžių ar terminų rinkinys naudojamas siekiant, kad savavališka, nuolat besikeičianti ar netvarkinga informacija būtų prieinamesnė vartotojams. Paieškos terminai interneto paieškos sistemoje, įmonės informacijos duomenų bazėje ir net skaitmeninėje tyrimų bibliotekoje yra programų, per kurias informaciją galima suskirstyti į metaduomenų terminus, o ne pagal griežtą hierarchinę struktūrą, pavyzdžiai. Žodžiai, naudojami apibūdinti objektą tokiose situacijose, sukuria tam tikrą paieškos indeksą, kuriame galima rasti didesnį informacijos telkinį.

Vieną kontroliuojamo žodyno naudojimo pavyzdį galima pamatyti svarstant įmonės failų sistemą. Failai turi būti suskirstyti į kategorijas, kad juos būtų galima lengvai ir nuspėjamai atkurti. Jei viena byla susijusi su automobiliais, ji gali būti įtraukta į kategoriją „automobiliai“. Jei kitas asmuo taip pat turėtų failą, kuriame kalbama apie automobilius, be valdomo žodyno, failas gali būti patalpintas antraštėje „automobiliai“, todėl du failus būtų sunku rasti atliekant vieną paiešką. Kai kategorijos yra kontroliuojamos, visos bylos, susijusios su automobiliais, būtų įtrauktos į vieną sutartą antraštę.

Kontroliuojamo žodyno naudojimo pranašumas yra tas, kad informacija yra griežtai aprašyta nuspėjamu būdu. Tai reiškia, kad kiekvienas, žinantis žodyną, galės efektyviai ir tiksliai ieškoti informacijos. Tačiau žodyno komplikacija yra ta, kad paieškos terminus yra sunkiau, o gal net neįmanoma generuoti automatiškai ir paprastai reikia tam tikro žmogaus įsikišimo, todėl esamų duomenų bazių konvertavimas į kontroliuojamą žodyną yra didelė užduotis. Jei žodynas nėra pakankamai didelis, taip pat yra galimybė, kad viena užklausa atneš tokį didelį informacijos kiekį, kad būtų nepraktiška rūšiuoti nenaudojant kito užklausos metodo.