Kas yra stabdymo žodis?

Skaičiavimo ir internetinėse programose stabdomasis žodis yra žodis, kuris išfiltruojamas apdorojant tam tikro tipo tekstą, pavyzdžiui, pradedant paiešką internete. Žinomas kaip vienas natūralios kalbos apdorojimo arba NLP komponentų, šio tipo filtravimo idėja yra padėti paspartinti paieškas, praleidžiant įprastus kalbos straipsnius. Vietoj to, paieškos variklis naudoja paprastą žymeklį, kad pastebėtų žodžio buvimą teksto eilutėje, bet netrukdo šiam žymekliui įtraukti tą puslapį į paieškos rezultatus.

Vienas iš būdų suprasti, kaip sustabdymo žodžiai gali apsunkinti paieškos sistemų funkciją, yra atsižvelgti į tai, kad atlikdama paiešką variklis atsižvelgs į kiekvieną žodį, įtrauktą į vartotojo pateiktą paieškos užklausą. Atsižvelgdamas į tai, variklis ieško puslapių, kuriuose yra kiekvienas žodis. Tai reiškia, kad jei paieškos užklausoje yra trys žodžiai, variklis tris kartus naršo internete, galiausiai suteikdamas pirmenybę puslapiams, kuriuose yra visi trys žodžiai.

Pavyzdžiui, norint atlikti paiešką, pvz., „namas ant kalvos“, variklis turėtų ieškoti kiekvieno sekos žodžio, o kai kurie net du kartus atliks paiešką pagal baigiamojo žodžio „the“. Tai užima laiko ir išteklių, kuriuos būtų galima panaudoti kitų galutinių vartotojų atliekamoms kitoms raktinių žodžių paieškoms. Naudodamas žymeklius, kad pakeistų „the“ ir „on“ paieškos metu, variklis gali skirti mažiau išteklių ir vis tiek pateikti rezultatus, kurie, greičiausiai, patenkins galutinį vartotoją.

Nors stabdymo žodis kartais vadinamas nuodingu žodžiu, tikrai nėra nieko blogo įtraukiant kalbos straipsnius į tekstą, naudojamą atliekant paieškas. Sustabdomojo žodžio ar žodžių naudojimas kaip paieškos užklausos dalis gali apsunkinti paieškos variklio indeksavimo procesą, kai bandoma gauti paieškos kriterijus atitinkančius duomenis. Vis dėlto galutinis vartotojas greičiausiai nepamatys daug skirtumų išgaunant informaciją, kuri galiausiai yra grąžinama.

Nėra griežto ir greito sustabdymo žodžių sąrašo, kuris būtų visuotinai naudojamas visose paieškos sistemose. Tiesą sakant, kai kurios paieškos sistemos nenaudoja jokio sustabdymo žodžių sąrašo kaip natūralios kalbos apdorojimo užduoties dalies. Tačiau kiti varikliai plačiai naudos baigiamųjų žodžių sąrašą kaip priemonę veiksmingiau paskirstyti išteklius, tuo pačiu pateikdami paieškos variklio rezultatus, kurie yra tikslūs ir gali būti labai tinkami paieškos užklausoms, kurias pateikia visi naudojant tam tikrą variklis.