Kas yra kanonizacija?

Žodis kanoninis reiškia kažką, kas atitinka priimtą standartą. Kanonizacija – arba kanonizacija britų anglų kalba – yra procesas, kurio metu kažkas suderinama su priimtu standartu. Kompiuterių srityje terminas „kanonizavimas“ vartojamas norint nurodyti atitikties standartams keliose skirtingose ​​srityse. Tai dažnai laikoma problema, kai iš tikrųjų tai yra įvairių problemų sprendimas. Kadangi tai toks ilgas žodis, kanonizacija sutrumpinama naudojant pirmąsias ir paskutines raides bei raidžių skaičių tarp jų: ​​c14n.

Kanonizavimas IT (informacinės technologijos) naudojamas keliose nustatymuose. Tai reiškia el. pašto siuntėjų adresus, failo vardo kūrimą, eilučių kodavimą Unicode, XML (Extensible Markup Language) ir URL (vienodo išteklių lokatoriaus) kūrimą. Kiekvienu atveju problema yra galimybė naudoti kelis formatus, vaizduojančius tą patį elementą, o kanonizavimas yra nuoseklumo ir standartizacijos būdas.

Paimkite XML kaip pavyzdį. XML leidžia atlikti sintaksinius pakeitimus. Tai reiškia, kad du netapatūs dokumentai gali turėti tą pačią kanoninę formą, taigi būti funkciškai lygiaverčiai. Canonical XML specifikacija buvo sukurta siekiant išspręsti šią problemą, nustatant metodą, pagal kurį galima nustatyti atskirų dokumentų tapatybę. Bet kurio XML dokumento kanoninės formos generavimo metodas vadinamas XML kanonizacijos metodu.

Jei norite kanonizuoti URL, konkretų tinklalapį reikia nuosekliai nurodyti vienu URL. Paprasčiausias pavyzdys yra dvi pagrindinio puslapio versijos, iš kurių viena turi tris w raides, o kita neturi:

http://www.Paaiškinta.com

palyginti su
http://Paaiškinta.com
Tai yra SEO (Search Engine Optimization) problema, nes ji padalija srauto ataskaitas, kurios visos iš tikrųjų nukreipiamos į tą pačią vietą. Dėl to atrodo, kad svetainė, turinti kelis tų pačių puslapių URL, veikia prasčiau, nei yra iš tikrųjų.
Be w, yra ir kitų problemų. Tai apima pasvirusius brūkšnius ir skirtumus tarp URL versijų su didžiosiomis ir mažosiomis raidėmis. Mattas Cutts iš Google® rekomenduoja tai išspręsti naudojant nuolatinį (301) visų alternatyvių URL peradresavimą į norimą URL, leidžiantį paieškos sistemoms nuspręsti, kuris yra kanoninis URL.