Kas yra garso kasyba?

Garso gavyba paprastai naudojama kalbos atpažinimo programinėje įrangoje ir muzikos analizėje. Ši technologija suteikia vartotojui galimybę ieškoti kalboje ar muzikos garso įraše, kurio specifinės charakteristikos buvo ištirtos. Kai naudojamas kalbos atpažinimo technologijoje, garso gavybos funkcija identifikuoja ištartus žodžius garso įraše ir įdeda juos į failą, kuriame galima ieškoti. Ši funkcija gali būti naudinga studentams arba verslo pasaulio atstovams, kurie dalyvauja daugelyje susitikimų, nes ji leidžia vartotojui lengviau naršyti aktualią informaciją iš kalbos pristatymų. Šio tipo analizė taip pat gali būti naudojama muzikoje, siekiant nustatyti tokias charakteristikas kaip dūžiai per minutę (BPM), muzikinis raktas ir muzikinė struktūra, informacija, kuri naudojama muzikai klasifikuoti.

Kalbos atpažinimo srityje, kur ši technologija naudojama dažniausiai, garso gavyba naudojama akustiniam modeliui sukurti. Akustinis modelis programuoja kalbos atpažinimo programinę įrangą, kad atpažintų kalbos modelius kaip žodžius. Ši technologija sukurta išgaunant garsą ištartos frazės įrašą, kuris lyginamas su ištartą frazę atitinkančiu tekstu. Kompiuteris naudoja informaciją, kad atpažintų žodžius, kai vartotojas skleidžia panašius garsus, kaip ir akustiniame modelyje. Akustinis modelis naudojamas kartu su failu, kuris nurodo kalbos atpažinimo programai, kokią kalbą interpretuoti ir kokie žodžių raštai gali būti ištarti tam tikruose sakiniuose ir situacijose.

Muzikantai ir muzikos klausytojai gali gauti naudos iš garso gavybos muzikoje. Kartais muzikos programinė įranga, skirstanti muziką pagal žanrą, naudoja garso gavybą muzikai tvarkyti. Procesas identifikuoja ir sugrupuoja muzikos failus su garso panašumais, kurie dažnai pasitaiko muzikos žanruose. Nors ši technologija gali palengvinti muzikos organizavimą ir naujos muzikos radimą, ji gali padaryti klaidų klasifikuojant dainas, kurių išmatuotos savybės panašios, tačiau bendras garsas skiriasi. Garso analizės programinė įranga gali būti naudinga muzikantams, ypač kompozitoriams, nes ji leidžia kompozitoriui pereiti prie konkrečių dainos struktūros dalių, įskaitant muzikinių klavišų pakeitimus ir žodžius.

Kalbos atpažinimo programinės įrangos gamintojas Dragon® parduoda programą, pavadintą AudioMining®, kuri transkribuoja garso failus ir pažymi failus, kad juose būtų galima ieškoti teksto. „Dragon“ yra kompiuterinių lingvistikos programų, techninis terminas kalbai interpretuoti skirtos programinės įrangos sričiai, gamintojas. Garso gavyba, kai naudojama kaip du žodžiai, yra bendras terminas, nurodantis garso failo analizę, siekiant nustatyti garso charakteristikų rinkinį. Kiti garso gavybos programinės įrangos gamintojai yra „Nuance®“ ir „Nexidia®“.