Mašininis klausymasis yra garsų apdorojimas kompiuteriu tokiu būdu, kuris imituoja žmogaus signalų apdorojimą. Kompiuteriai gali būti užprogramuoti ir išmokyti atpažinti ir interpretuoti įvairias garso įvestis. Ši technologija gali būti taikoma įvairiais būdais, nuo intelekto analizės iki muzikos studijų. Šios srities mokslininkai dirba privačiose įmonėse, akademinėse institucijose ir vyriausybinėse agentūrose, siekdami tobulinti mašininio klausymo įrankius ir rasti naujų pritaikymų. Jame integruoti akustikos, elektrotechnikos, robotikos ir signalų apdorojimo elementai.
Kad atpažintų garsus, kompiuteriai turi mokėti juos girdėti ir apdoroti. Jie gali naudoti garso imtuvus aplinkos triukšmui valdyti arba gali klausytis įrašų. Garsus galima paleisti naudojant algoritmus, siekiant nustatyti, kas jie yra ir ką su jais daryti. Kompiuterių atsakymai gali priklausyti nuo jų programavimo, mokymo ir sudėtingumo lygio.
Paprastas klausymosi mašininiu pavyzdžiu galima pamatyti naudojant plokštes ir balsu aktyvuojamą programinę įrangą. Plakstuvai leidžia žmonėms įjungti ir išjungti grandines, suspaudžiant ranką, kuri įjungia pagrindinį įrenginį. Programinė įranga, reaguojanti į balso komandas, gali leisti žmonėms ją valdyti balsu, todėl reikia gebėjimo atpažinti balsą ir interpretuoti garsus. Tokiose programose gali būti naudojami mokymai, skirti išmokti atpažinti konkretų kalbėtoją ir valdyti kirčius, sintaksės pokyčius ir kitus garsiakalbių skirtumus.
Sudėtingesnis mašinų klausymas gali būti naudojamas tokiose srityse kaip muzika, kur mokslininkai nustato ir tiria modelius. Pavyzdžiui, kriminalistai muzikologai gali palyginti ir supriešinti muziką iš skirtingų šaltinių ir savo darbe gali naudoti mašininį klausymąsi. Jie gali nustatyti, ar muzika yra bendros kilmės, ar turi kitų dominančių savybių. Ši technologija taip pat gali būti naudojama tiriant harmoniją ir kuriant teorijas apie tai, kaip galėjo skambėti istorinė muzika.
Intelekto analizė taip pat priklauso nuo mašinos klausymosi. Žvalgybos agentūroms gali tekti apdoroti didžiulius garso duomenų kiekius pokalbių telefonu, diskusijų viešose erdvėse ir kt. Mokėti žmonėms, kad jie išklausytų visus garso įrašus ir rengtų ataskaitas, gali būti brangu, o nuobodžiaujantys klausytojai gali praleisti svarbią informaciją. Įrenginio klausymasis gali leisti agentūrai automatiškai apdoroti garsą, kad ištrauktų duomenis, į kuriuos reikia atidžiai atkreipti dėmesį, remiantis raktiniais žodžiais, balso tonais ir kitais parametrais. Žvalgybos analitikai gali nustatyti savo darbo prioritetus, remdamiesi šia automatine analize, kad pirmiausia išklausytų garsą, kuris greičiausiai bus svarbus.