Приказ основних података о документу

Polysemy effect in processing of Serbian nouns

dc.contributor.advisorKostić, Aleksandar
dc.contributor.otherTodorović, Dejan
dc.contributor.otherMilin, Petar
dc.contributor.otherMoscoso del Prado Martin, Fermin
dc.creatorFilipović Đurđević, Dušica
dc.date.accessioned2021-10-12T09:56:58Z
dc.date.available2021-10-12T09:56:58Z
dc.date.issued2007
dc.identifier.urihttp://eteze.bg.ac.rs/application/showtheses?thesesId=729
dc.identifier.urihttp://nardus.mpn.gov.rs/handle/123456789/3266
dc.identifier.urihttp://vbs.rs/scripts/cobiss?command=DISPLAY&base=70036&RID=33021199
dc.identifier.urihttp://reff.f.bg.ac.rs/handle/123456789/5
dc.description.abstractU ovom istraživanju ispitano je da li na vreme obrade polisemičnih reči, pored broja značenja, utiče i entropija distribucije verovatnoća značenja, odnosno ujednačenost verovatnoća značenja. Pošto je vrednost entropije određena ujednačenošću verovatnoća značenja (redundansa distibucije verovatnoća) i brojem značenja, u dva eksperimenta sa zadatkom leksičke odluke ispitano je da li ove dve komponente entropije nezavisno utiču na vreme obrade. Najpre je prikupljeno nekoliko mera višeznačnosti za 150 polisemičnih imenica srpskog jezika. Mere su izvedene za značenja navedenih u Rečniku Matice srpske i značenja koja su naveli ispitanici, govornici srpskog jezika. Na osnovu odgovora ispitanika utvrđen je broj značenja, proporcija navođenja različitih značenja, entropija i redundansa distribucije verovatnoća značenja. U prvom eksperimentu, broj značenja i entropija/redundansa tretirani su kao kontinuirani prediktori u regresionim analizama. U drugom eksperimentu, prikazane su dve grupe polisemičnih imenica koje su imale mali, odnosno veliki broj značenja i ujednačene (niska redundansa), odnosno neujednačene verovatnoće značenja (visoka redundansa). U oba eksperimenta, rezultati su pokazali statistički značajne efekte entropije i redundanse nakon što je izdvojena varijansa objašnjena dužinom reči, frekvencijom leme, familijarnošću, konkretnošću i brojem značenja. Konačno, validiran je jedan metod za kvantitativno opisivanje višeznačnih reči na osnovu višedimenzionalne distribucije kontekstualnih vektora. Na osnovu matrice kovarijanse distribucije kontekstualnih vektora pojedinačnih pojavljivanja polisemičnih reči srpskog jezika izvedena je entropija ekvivalentne Gausove distribucije koja predstavlja meru varijabilnosti u višedimenzionalnom prostoru i odslikava postojanje povezanih značenja reči (polisemija). Preko razlike između entropije ekvivalentne Gausove distribucije i diferencijalne entropije funkcije gustine verovatnoće kontekstualnih vektora izvedena je negentropija funkcije gustine verovatnoće koja odslikava postojanje nepovezanih značenja (homonimija). U skladu sa predviđanjima, na skupu polisemičnih imenica srpskog jezika, zabeležen je samo efekat entropije ekvivalentne Gausove distribucije. Negentropija nije imala uticaj na vreme reakcije, što ukazuje na odsustvo kompeticije između povezanih značenja polisemičnih reči. Dobijeni rezultati ukazuju na izuzetnu osetljivost kognitivnog sistema na probabilističke odlike jezika.sr
dc.description.abstractThe present study aims to demonstrate that in addition to number of senses, entropy of sense probability distribution, that is balance of sense probabilities affects processing of polysemous words. Entropy is affected by two sources of uncertainty: balance of sense probabilities (redundancy of probability distribution) and number of senses. With this in mind, we made an attempt to demonstrate that two components of entropy have distinct effects on processing time. Firstly, we collected several measures of ambiguity for 150 Serbian polysemous nouns. Ambiguity measures are derived separately for dictionary senses, and senses provided by native speakers. Based on provided senses, we calculated number of senses, proportion of each sense, entropy and redundancy of sense probability distribution. In the first experiment, number of senses and entropy/redundancy were continuous predictors in multiple regression analyses. In the second experiment, groups of polysemous nouns were selected to have either few, or many senses, and either balanced (low redundancy) or unbalanced (high redundancy) sense probability distributions. In both experiments, analyses revealed significant effects of either redundancy, or entropy after partialling out contributions of several control variables. Finally, a method for quantitative description of ambiguous words based on multidimensional distribution of context vectors was validated. Based on covariance matrix Еntropy of equivalent Gaussian distribution (EGE) is derived, representing a measure of general variability in multidimensional space, reflecting related senses of a word (polysemy). By substracting EGE from differential entropy of probability density function of context vectors we derived negentropy, which reflects word’s unrelated meanings (homonymy). As predicted, for the set of polysemous nouns only EGE accounted for significant proportion of variance of processing latencies. Negentropy had no effect on reaction time, indicating the absence of competition between related senses of polysemous words. The obtained results demonstrate high sensitivity of cognitive system to probabilistic properties of language.en
dc.languagesr
dc.publisherUniverzitet u Beogradu, Filozofski fakultet
dc.rightsopenAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectvеktоrski zаsnоvаnа sеmаntičkа аnаlizаsr
dc.subjectvrеmе оbrаdеsr
dc.subjectvišеznаčnоst rеčisr
dc.subjectrеdundаnsаsr
dc.subjectpоlisеmiјаsr
dc.subjectnеgеntrоpiјаsr
dc.subjectentropijasr
dc.subjectentropija ekvivalentne Gausove distribucijesr
dc.subjectbrој znаčеnjаsr
dc.subjectanaliza linearnih mešovitih efekatasr
dc.subjectword ambiguityen
dc.subjectvector based semantic analysisen
dc.subjectredundancyen
dc.subjectprocessing timeen
dc.subjectpolysemyen
dc.subjectnumber of sensesen
dc.subjectnegentropyen
dc.subjectlinear mixed-effect regressionen
dc.subjectentropyen
dc.subjectentropy of equivalent Gaussian distributionen
dc.titleEfekat višeznačnosti na obradu izolovanih u srpskom jezikusr
dc.titlePolysemy effect in processing of Serbian nounsen
dc.typedoctoralThesis
dc.rights.licenseBY-NC-ND
dc.identifier.fulltexthttp://reff.f.bg.ac.rs/bitstream/id/1630/2.pdf
dc.identifier.rcubhttps://hdl.handle.net/21.15107/rcub_nardus_3266
dc.type.versionpublishedVersion


Документи

Thumbnail

Овај документ се појављује у следећим колекцијама

Приказ основних података о документу