Kalbos sintezė yra procesas, kai žodinis bendravimas atkartojamas naudojant dirbtinį įrenginį. Kompiuteris, konvertuojantis tekstą į kalbą, yra viena iš kalbos sintezatorių.
Ankstyviausios kalbos sintezės formos buvo įgyvendintos naudojant mašinas, skirtas veikti kaip žmogaus balso traktas. Pavyzdžiui, 1700-aisiais Wolfgango von Kempeleno sukurta kalbėjimo mašina. Šiuo prietaisu kalba buvo skleidžiama per virtuvės dumplą, dūdmaišį ir klarneto varpą. Virtuvės silfonas buvo sukurtas taip, kad veiktų kaip plaučiai, o balsas (balso stygų sritis) buvo pavaizduotas per dūdmaišį. Klarneto varpas tarnavo kaip burna.
Prietaiso valdymas buvo visiškai rankinis. Dešinė ranka valdė keletą svirčių, o kaire ranka manipuliavo klarneto varpeliu (burna). Taip pat buvo galimybė užkimšti „šnerves“, kad sklistų mažiau nosies garsų. Bet kuriuo atveju, kol pagrindiniai valdikliai buvo tinkamai naudojami, mašina gaudavo oro srautą. Šis oro srautas lėmė sklindančių garsų tipus.
Vėlesni kalbėjimo aparatai XVIII ir XIX amžiuose išlaikė šią sąranką, nors buvo ir patobulinimų. Pavyzdžiui, 18-ųjų pabaigoje Josephas Faberis sukūrė kalbėjimo aparatą, galintį priimti įvestį per klaviatūrą ir pedalą. Mašina taip pat buvo labai kūrybinga, nes garsas sklinda per dirbtinį „veidą“.
Kai atėjo XX amžius, elektronikos naujovės leido kalbos sintezei pasiekti dar galingesnę kryptį. Nors prielaida imituoti žmogaus balso traktą vis dar buvo ta pati, XX amžiaus pradžios kalbėjimo aparatai galėjo skleisti geresnius garsus, nes įvestis buvo tikslesnė.
Tačiau tik atsiradus kompiuteriams kalbos sintezė iš tikrųjų galėjo būti naudojama ne pramogų arenoje. Taip yra daugiausia todėl, kad kalbos sintezatoriai gali būti saugomi programinėje įrangoje, o ne atskirame įrenginyje. Be to, naudojant kompiuterius kaip pagalbinę priemonę, kalbos sintezė gali įgauti kitokią formą; naudojant žmonių balsus kaip pagrindinį garso šaltinį.
Ši kalbos sintezės forma žinoma kaip konkatenatyvinė. Procesas veikia jungiant įvairius žmogaus kalbos įrašus. Gautas garsas yra daug natūralesnis ir malonesnis ausiai. Tai skiriasi nuo programų, kuriose naudojama artikuliacinė sintezė, kai kalba atkartojama naudojant kompiuterinį balso trakto modelį.
Komerciniai kalbos sintezatoriai gali naudoti konkatenacinius arba artikuliacinius metodus, tačiau abu gali pasiekti tą patį tikslą; suteikti žmonėms galimybę išgirsti tekstą. Tai ypač naudinga tais atvejais, kai skaitymas įkyrus arba neįmanomas.
Verslo pasaulyje tokios situacijos yra labai dažnos, ypač atliekant sandorius telefonu. Be teksto į kalbą (TTS) alternatyvų verslo savininkai turėtų išleisti pinigus samdydami dar daugiau klientų aptarnavimo personalo. Sintetiniai sprendimai šios problemos išvengia, nes viskas daroma kompiuteriu; ne žmogus.
Sintetinė kalba taip pat vaidina svarbų vaidmenį kasdieniame gyvenime, ypač neįgaliems asmenims. Kalbantis laikrodžiai, žodynai ir kiti įrenginiai gali palengvinti žmonių, kuriems sunku matyti ar skaityti, darbą. Sintetinė kalba netgi gali duoti balsą asmenims, kurie visiškai negalėjo kalbėti. Garsus fizikas Stevenas Hawkingas yra ryškus pavyzdys. Kadangi Lou Gehrig liga jį nutildė, Hokingas naudoja balso sintezatorių, kad bendrautų su žmonėmis.
Taip pat yra TTS programų, padedančių žmonėms atlikti įvairią kompiuterio veiklą. Norėdami gauti tokio tipo programas, dauguma vartotojų turės nusipirkti atskirą programinę įrangą arba atsisiųsti pataisas. Pastaroji parinktis dažniausiai yra nemokama, priklausomai nuo naudojamos operacinės sistemos ar teksto apdorojimo programos. Tačiau jei žmogus nuspręstų įsigyti atskirą programinę įrangą, jis galėtų turėti prieigą prie kokybiškesnės sistemos. Konkrečius pavyzdžius galima pamatyti naudojant „Natural Reader 7“ ir „Text Aloud 2“.
Galiausiai kalbos sintezė yra technologija, kuri pakeitė žmonijos bendravimo būdą. Tam tikra prasme tai suteikia tekstui savo gyvenimą. Tai taip pat suteikia pasauliui galimybę išgirsti nuostabių asmenų, kurie paprastai būtų be balso, mintis.