Paskirstymo hipotezė iškelia idėją, kad žodžiai, turintys tą pačią reikšmę, yra grupuojami tekstuose. Idėja tiria žodžių reikšmes ir jų pasiskirstymą tekste. Tada tai lyginama su žodžių, turinčių panašias ar susijusias reikšmes, pasiskirstymu. Tokie tyrimai nustato, kad žodžiai atsiranda kartu jų kontekste dėl panašių ar susijusių reikšmių.
Paskirstymo hipotezę pirmasis pasiūlė britų kalbininkas JR Firthas. Jis yra žinomas dėl garsiausios citatos apie idėją „Jūs žinosite žodį iš įmonės, kurią ji saugo“. Firthas, kuris taip pat yra gerai žinomas dėl savo studijų apie prozodiją, tikėjo, kad jokia sistema niekada nepaaiškins, kaip veikia kalba. Vietoj to jis manė, kad reikės kelių persidengiančių sistemų.
Amerikiečių kalbininkas Zelligas Harrisas rėmėsi Firth darbu. Jis norėjo panaudoti matematiką kalbiniams duomenims tirti ir analizuoti. Jo idėjos apie matematikos indėlį į tokius tyrimus yra svarbios, tačiau jis taip pat žinomas dėl to, kad per savo gyvenimą jis apėmė daugybę kalbinių idėjų.
Pasiskirstymo hipotezės tyrimai yra lingvistikos tyrimo dalis. Dideliems kalbos duomenų kiekiams atsijoti naudojami matematiniai ir statistiniai metodai, o ne kalbiniai. Taigi tai reiškia, kad pasiskirstymo hipotezė yra kompiuterinės lingvistikos ir statistinės semantikos dalis. Jis taip pat susijęs su kalbininkų ir kalbotyros filosofų mintimis apie vaikų gimtosios kalbos vystymąsi – procesą, žinomą kaip kalbos įgijimas.
Statistinė semantika naudoja matematinius algoritmus žodžių pasiskirstymui tirti. Tada šie rezultatai filtruojami pagal reikšmę ir toliau tiriami, siekiant išsiaiškinti žodžių, susijusių pagal reikšmę, pasiskirstymą. Yra du pagrindiniai statistinės semantikos metodai: skirstymas pagal žodžių grupes ir pagal teksto sritis.
Žodžių pasiskirstymo pagal susijusių reikšmių grupes tyrimas vadinamas hipererdvės analogu kalbai (HAL). HAL nagrinėja žodžių, sugrupuotų tekste, santykius. Tai gali būti sakinio viduje arba pastraipoje, bet retai kur toliau. Semantinį žodžių pasiskirstymą lemia tai, kaip dažnai žodžiai atsiranda vienas šalia kito.
Viso teksto studijoms naudojama latentinė semantinė analizė (LSA). Tai natūralus kalbos apdorojimo metodas. Žodžiai, turintys artimą reikšmę, bus arti vienas kito visame tekste. Tokie tekstai tiriami dėl klasterių naudojant matematinį metodą, vadinamą Singular Value Decompression (SVD).
Duomenys, gauti iš pasiskirstymo hipotezės tyrimų, naudojami semantikos ir žodžių ryšių statybiniams blokams tirti. Peržengus struktūralistinį požiūrį, hipotezę galima pritaikyti dirbtiniam intelektui (DI). Tai padėtų kompiuterinėms programoms geriau suprasti žodžių ryšį ir paskirstymą. Tai taip pat turi įtakos tam, kaip vaikai apdoroja žodžius ir kuria žodžių asociacijas bei sakinius.