Kas yra dinaminis laiko deformavimas?

Dinaminis laiko deformavimas (DTW) apima skaičiavimo metodą, vadinamą algoritmu, kad būtų galima palyginti garsus, vaizdo įrašus ir grafiką, kurie gali būti panašūs, bet kurių pavyzdžiai gali šiek tiek skirtis. Skaičiavimai paprastai formuluoja linijinį imties vaizdą ir matuoja skirtumus kaip laiko funkciją. Skirtingi pavyzdžio elementai gali būti susieti tinklelyje, kad būtų nustatyti panašumai, o funkcijų komandose dažnai naudojami simboliai kiekvienam kintamajam identifikuoti. Pavyzdžiui, kalbos atpažinimas kartais naudoja dinaminį laiko deformavimą, kad atitiktų žodžius, net jei jie kalba skirtingu greičiu arba kai kurios dalys tariamos skirtingai.

Daugelis kalbos atpažinimo programų naudoja dinaminį laiko deformavimą, nes žmonės dažnai kalba skirtingu greičiu. Tam tikri balsių garsai gali būti tariami skirtingai, atsižvelgiant į emocijas ar kitus veiksnius. Kai kurios programos gali atpažinti ištartus žodžius, nesvarbu, kas kalba. Dėl šios priežasties paprastai neveiksminga sumuoti atstumus laiko intervalais, kad būtų galima palyginti garsus. Naudojant DTW, analizuojami įvairūs kiekvieno signalo laiko taškai; šie atstumai apskaičiuojami tinklelyje, kuris eina iš apačios į kairę į viršų į dešinę.

Dviejų pavyzdžių atitinkamų dalių panašumus galima išmatuoti naudojant Levenshteino atstumą. Raidės naudojamos norint pavaizduoti pokyčius tarp vieno šaltinio ir kito. Algoritmo sprendimas paprastai yra didesnis skaičius, tuo labiau skiriasi du pavyzdžiai. Ši sąvoka dažnai naudojama kalbos atpažinimui, taip pat rašybos tikrinimui ir genetinės medžiagos analizei.

Kai kuriais matavimais dažnio pokyčiai gali kompensuoti dinaminio laiko deformavimo galimybę. Signalus galima apskaičiuoti taip, kad jų forma būtų naudojama nepriklausomai nuo dažnio. Moduliuoti signalai taip pat gali kelti problemų, tačiau tinklelis, apskaičiuojantis atstumus tarp linijos atkarpų, o ne taškų, gali kompensuoti.

Sekos derinimas paprastai yra matematinis ir norint jį visiškai suprasti, reikia tam tikrų kompiuterinio programavimo įgūdžių. Dinaminiai laiko deformavimo algoritmai priklauso nuo kai kurių pagrindinių sąlygų, leidžiančių realiai apskaičiuoti garso ar vaizdo pavyzdžių skirtumus. Laikydamas pavyzdį kaip kelią palei tinklelį, algoritmas dažnai vadovaujasi taisyklėmis, pvz., kelias negali pasukti atgal ir matuojamas po žingsnį. Be formato iš apačios iš kairės į viršų į dešinę, matavimai atliekami tik vietose, esančiose arti įstrižainės linijos. Per stačios arba seklios reikšmės dažnai nepaisomos, nes jos gali sukelti galutinio matavimo klaidų.