Kas yra semantinė integracija?

„Semantinė integracija“ yra terminas, vartojamas įvairiuose kontekstuose įvairiose kompiuterių projektavimo, programavimo, valdymo ir administravimo srityse. Apskritai tai reiškia informacijos iš vieno ar kelių skirtingų šaltinių apibendrinimą, siekiant sukurti tam tikrą sistemą, kurioje informacija būtų sutvarkyta vartotojui suprantamu būdu. Semantinė integracija dažnai susijusi su metaduomenų jungčių arba ryšių tarp skirtingų skirtingų duomenų šaltinių dalių apibrėžimu ir nustatymu, kad juos būtų galima logiškai struktūrizuoti. Tai gali apimti reliacinių ryšių tarp dviejų atskirų duomenų bazių kūrimą, grafiko kūrimą, kaip skirtingų svetainių dalys yra susijusios viena su kita, arba faktinių duomenų iš nežinomo, savavališko formato integravimą į glaustą įrašų struktūrą. Yra daug praktinių visiškai įdiegtos semantinės integracijos sistemos pritaikymo būdų, įskaitant mokslinių tyrimų bibliotekas ar tinklus, organiškesnius paieškos sistemų algoritmus, kurie gali ekstrapoliuoti kontekstą iš paieškos ir galiausiai – naudojant metaduomenų publikavimą – sklandų skirtingų kompiuterinių sistemų integravimą duomenų mainams. .

Galutinis semantinės integracijos tikslas daugeliu atvejų yra galimybė dinamiškai susieti informaciją. Labai paprastame pavyzdyje tai gali reikšti galimybę susieti vienos duomenų bazės laukus su kitos duomenų bazės laukais, nepaisant to, kad jie nėra tikslūs atitikmenys, pvz., susieti lauką pavadinimu „dydis“ su lauku pavadinimu „aukštis“. Šis susiejimas gali būti atliktas taikant vartotojo apibrėžtas taisykles, kurios konkrečiai susieja šias dvi, arba naudojant algoritmus, kurie lygina skaitinius laukų duomenis ir nustato tikėtiną atitiktį. Tada žodžiai „dydis“ ir „aukštis“ tampa metaduomenų terminais, kuriuos kitos išorinės semantinės integracijos sistemos gali naudoti, kad surastų informaciją vartotojui, nežinant, kaip kuri nors atskira sistema saugo duomenis.

Sudėtingose ​​semantinės integracijos sistemose, pvz., skirtose tyrimams, metaduomenų publikavimas ir dalijimasis yra pagrindinis veikimo komponentas. Metaduomenys gali būti paimti iš dokumentų, kad būtų sudarytos didelės reliacinės duomenų struktūros, kurios gali padėti atlikti užklausas. Tai reiškia, kad mokslinius tyrimus bet kuria tema galima integruoti į sistemą, kuri matuoja ir registruoja žodžių dažnį, o šie žodžiai gali padėti vartotojui ieškant informacijos, todėl susijusias temas galima įtraukti iš bet kurio šaltinio, nereikalaujant konkrečių konversijų.

Vienas iš iššūkių, su kuriuo susiduria semantinės integracijos sistemų kūrėjai, yra duomenų agregavimas. Žmonių naudojimas klasifikuojant ir užmezgant ryšius tarp duomenų iš įvairių šaltinių gali užtrukti ir galiausiai labai priklausyti nuo individualios asmens patirties. Kai algoritmai naudojami automatiškai sukurti asociacijas, tam tikri ryšiai gali būti nepastebėti dėl nedidelio skirtumo, kurio algoritmas negali išspręsti. Semantinės integracijos plataus masto įgyvendinimo metodas naudoja mokymusi pagrįstus algoritmus kartu su žmogaus pagrįstu taisyklių valdymu ir kai kuriais atvejais faktiniu žmogaus sprendimų priėmimu proceso metu.