Kas yra garso transkripcija?

Garso transkripcija yra ištartų žodžių paėmimas ir pavertimas rašytiniu tekstu. Anksčiau žmogus sėdėdavo ir rašydavo žodžius taip, kaip jie buvo sakomi. Dabar egzistuoja įvairių tipų garso įrašai ir keli transkripcijos būdai. Analoginiai ir skaitmeniniai įrašymo metodai leis asmeniui, kurio pokalbio metu nėra, vis tiek perrašyti tekstą. Be to, daugelis programinės įrangos paketų nuskaitys garso failus ir greitai konvertuos juos į tekstą, nereikės jų paleisti.

Daugelį metų garso transkripcija buvo specializuota ir varginanti profesija. Kalbėjimą transkribuojantys žmonės turėjo dalyvauti kalbėjimo metu, o tai dažnai reiškia, kad įmonės turės samdyti žmones, apmokytus pažangių metodų, pavyzdžiui, stenografijos. Tai taip pat apribojo transkripcijos paslaugas tiems, kurie turėjo prieigą prie apmokyto transkribuotojo.

Išradus garso įrašus ši sritis kardinaliai pasikeitė. Su įrašu transkribuotojas galėtų dirbti iš bet kurios vietos, kur būtų galima pristatyti įrašą. Be to, transkripcijai nebereikėjo stenografuoti, nes įrašą buvo galima apversti ir klausytis kelis kartus. Viena transkribuotoja taip pat galėtų vienu metu dirbti daugybei klientų, nes jai nebereikėjo dalyvauti kalbant.

Didėjant kompiuterių naudojimui ir interneto greičiui, garso transkripcijos sritis iš esmės išliko tokia pati. Failai, o ne juostos, dažnai buvo siunčiami el. paštu, o ne įprastu paštu. Proceso greitis padidėjo, bet metodai – ne.

Tai pasikeitė 90-ųjų pabaigoje, kai vis dažniau buvo naudojama kalbos atpažinimo ir diktavimo programinė įranga. Transkribavimo darbas vis labiau buvo nukreiptas į kompiuterinę pagalbą, o vėliau – visišką automatizavimą. Pasirodė programinės įrangos paketai, galintys nuskaityti informaciją garso faile ir naudoti kalbėtojo bangų modelius, kad sukurtų tekstinę kalbos versiją. Tai užtruks kelias sekundes, o ne minutes ar valandas žmogaus transkribuotojo.

Kompiuteriu automatizuota garso transkripcija turi keletą sunkiai pašalinamų trūkumų, iš kurių didžiausias yra santykinis korekcinės kalbos trūkumas. Kai transkribuotojas klausosi teksto, jis gali ištaisyti nedideles kalbos klaidas, kad būtų lengviau skaitomas. Nors kai kurios transkripcijos yra pažodinės, tai reiškia, kad tai yra būtent tai, ką žmogus pasakė, dauguma – ne. Be korekcinės kalbos, žmogus dažnai turės patikrinti, ar transkripcijoje nėra klaidų, prieš jį naudojant.

Kitas dažnas kompiuterinio garso transkripcijos trūkumas slypi pačioje žmonių kalboje. Kadangi kalbėdami žmonės turi daugybę tonų ir raštų, sukurti kompiuterinę programą, kuri galėtų tiksliai perskaityti ir išversti visą diapazoną, yra ypač sunku. Tai reiškia, kad beveik visos transkripcijos programinės įrangos klaidos yra dažnos. Dažniausias būdas apeiti šį trūkumą yra išmokta kalba, kai programa ir vienas kalbėtojas veikia pakankamai kartu, kad programa sutelktų dėmesį į vieno asmens modelius.