Vektorski zasnovana semantička analiza polisemičnih reči
Vector based semantic analysis reveals absence of competition among related senses
Abstract
Ranija istraživanja pokazala su da je porast u broju povezanih značenja (polisemija) praćen kraćim vremenom obrade reči, dok je porast u broju nepovezanih značenja (homonimija) praćen dužim vremenom obrade reči. U ovom istraživanju evaluirali smo metod za kvantitativno opisivanje višeznačnih reči na osnovu višedimenzionalne distribucije kontekstualnih vektora kojeg su predložili Moscoso del Prado Martín i saradnici. Na osnovu distribucije kontekstualnih vektora pojedinačnih pojavljivanja polisemičnih reči srpskog jezika izračunata je entropija ekvivalentne Gausove distribucije i negentropija funkcije gustine verovatnoće. Entropija ekvivalentne Gausove distribucije, koja je izvedena iz matrice kovarijanse, predstavlja meru varijabilnosti u višedimenzionalnom prostoru i odslikava postojanje povezanih značenja reči (polisemija). Negentropija predstavlja razliku između entropije ekvivalentne Gausove distribucije i diferencijalne entropije funkcije gustine verovatnoće kontekstualnih vektora... i odslikava postojanje nepovezanih značenja (homonimija). U skladu sa predviđanjima, na skupu polisemičnih imenica srpskog jezika, zabeležen je samo efekat entropije ekvivalentne Gausove distribucije. Negentropija nije imala uticaj na vreme reakcije. Ovaj nalaz je u skladu sa pretpostavkom da entropija ekvivalentne Gausove distribucije, kao mera širine aktivacije u semantičkom prostoru, odslikava polisemiju, odnosno prisustvo povezanih značenja reči. Stoga se prednost u obradi polisemičnih reči može objasniti širokom aktivacijom u semantičkom prostoru i smanjenom kompeticijom među Gausovim distribucijama koje se preklapaju u velikoj meri.
Previous research demonstrated that processing time was facilitated by number of related word senses (polysemy) and inhibited by number of unrelated word meanings (homonymy). The starting point of this research were the findings described by Moscoso del Prado Martín and colleagues, who offered a unique account of processing of two forms of lexical ambiguity. By applying the techniques they proposed, for the set of strictly polysemous Serbian nouns we calculated ambiguity measures they introduced. Based on the covariance matrix of the context vectors, we derived entropy of equivalent Gaussian distribution, and based on the context vectors probability density function, we derived differential entropy. Negentropy was calculated as the difference between the two. Based on interpretation that entropy of equivalent Gaussian mirrors sense cooperation, or polysemy, while negentropy mirrors meaning competition, or homonymy, we predicted that in the set of strictly polysemous nouns, negentropy e...ffect would disappear. In accordance with our predictions, entropy of equivalent Gaussian distribution accounted for significant proportion of processing latencies variance. Negentropy did not affect reaction time. This finding is in accordance with the hypothesis that entropy of equivalent Gaussian distribution, as a measure of general width of activation in semantic space, reflects polysemy, that is, the existence of related senses. Therefore, polysemy advantage could be the result of the wide-spread activation in semantic space and reduced competition among overlapping Gaussians.
Keywords:
semantički prostor / polisemija / negentropija / kontekstualni vektori / entropija ekvivalentne Gausove distribucije / diferencijalna entropija / semantic space / polysemy / negentropy / equivalent Gaussian entropy / differential entropy / context vectorsSource:
Psihologija, 2009, 42, 1, 95-106Publisher:
- Društvo psihologa Srbije, Beograd
Funding / projects:
- Fundamentalni kognitivni procesi i funkcije (RS-149039)
DOI: 10.2298/PSI0901095F
ISSN: 0048-5705
WoS: 000263652700006
Scopus: 2-s2.0-77950529561
Institution/Community
Psihologija / PsychologyTY - JOUR AU - Filipović Đurđević, Dušica AU - Đurđević, Đorđe AU - Kostić, Aleksandar PY - 2009 UR - http://reff.f.bg.ac.rs/handle/123456789/947 AB - Ranija istraživanja pokazala su da je porast u broju povezanih značenja (polisemija) praćen kraćim vremenom obrade reči, dok je porast u broju nepovezanih značenja (homonimija) praćen dužim vremenom obrade reči. U ovom istraživanju evaluirali smo metod za kvantitativno opisivanje višeznačnih reči na osnovu višedimenzionalne distribucije kontekstualnih vektora kojeg su predložili Moscoso del Prado Martín i saradnici. Na osnovu distribucije kontekstualnih vektora pojedinačnih pojavljivanja polisemičnih reči srpskog jezika izračunata je entropija ekvivalentne Gausove distribucije i negentropija funkcije gustine verovatnoće. Entropija ekvivalentne Gausove distribucije, koja je izvedena iz matrice kovarijanse, predstavlja meru varijabilnosti u višedimenzionalnom prostoru i odslikava postojanje povezanih značenja reči (polisemija). Negentropija predstavlja razliku između entropije ekvivalentne Gausove distribucije i diferencijalne entropije funkcije gustine verovatnoće kontekstualnih vektora i odslikava postojanje nepovezanih značenja (homonimija). U skladu sa predviđanjima, na skupu polisemičnih imenica srpskog jezika, zabeležen je samo efekat entropije ekvivalentne Gausove distribucije. Negentropija nije imala uticaj na vreme reakcije. Ovaj nalaz je u skladu sa pretpostavkom da entropija ekvivalentne Gausove distribucije, kao mera širine aktivacije u semantičkom prostoru, odslikava polisemiju, odnosno prisustvo povezanih značenja reči. Stoga se prednost u obradi polisemičnih reči može objasniti širokom aktivacijom u semantičkom prostoru i smanjenom kompeticijom među Gausovim distribucijama koje se preklapaju u velikoj meri. AB - Previous research demonstrated that processing time was facilitated by number of related word senses (polysemy) and inhibited by number of unrelated word meanings (homonymy). The starting point of this research were the findings described by Moscoso del Prado Martín and colleagues, who offered a unique account of processing of two forms of lexical ambiguity. By applying the techniques they proposed, for the set of strictly polysemous Serbian nouns we calculated ambiguity measures they introduced. Based on the covariance matrix of the context vectors, we derived entropy of equivalent Gaussian distribution, and based on the context vectors probability density function, we derived differential entropy. Negentropy was calculated as the difference between the two. Based on interpretation that entropy of equivalent Gaussian mirrors sense cooperation, or polysemy, while negentropy mirrors meaning competition, or homonymy, we predicted that in the set of strictly polysemous nouns, negentropy effect would disappear. In accordance with our predictions, entropy of equivalent Gaussian distribution accounted for significant proportion of processing latencies variance. Negentropy did not affect reaction time. This finding is in accordance with the hypothesis that entropy of equivalent Gaussian distribution, as a measure of general width of activation in semantic space, reflects polysemy, that is, the existence of related senses. Therefore, polysemy advantage could be the result of the wide-spread activation in semantic space and reduced competition among overlapping Gaussians. PB - Društvo psihologa Srbije, Beograd T2 - Psihologija T1 - Vektorski zasnovana semantička analiza polisemičnih reči T1 - Vector based semantic analysis reveals absence of competition among related senses EP - 106 IS - 1 SP - 95 VL - 42 DO - 10.2298/PSI0901095F ER -
@article{ author = "Filipović Đurđević, Dušica and Đurđević, Đorđe and Kostić, Aleksandar", year = "2009", abstract = "Ranija istraživanja pokazala su da je porast u broju povezanih značenja (polisemija) praćen kraćim vremenom obrade reči, dok je porast u broju nepovezanih značenja (homonimija) praćen dužim vremenom obrade reči. U ovom istraživanju evaluirali smo metod za kvantitativno opisivanje višeznačnih reči na osnovu višedimenzionalne distribucije kontekstualnih vektora kojeg su predložili Moscoso del Prado Martín i saradnici. Na osnovu distribucije kontekstualnih vektora pojedinačnih pojavljivanja polisemičnih reči srpskog jezika izračunata je entropija ekvivalentne Gausove distribucije i negentropija funkcije gustine verovatnoće. Entropija ekvivalentne Gausove distribucije, koja je izvedena iz matrice kovarijanse, predstavlja meru varijabilnosti u višedimenzionalnom prostoru i odslikava postojanje povezanih značenja reči (polisemija). Negentropija predstavlja razliku između entropije ekvivalentne Gausove distribucije i diferencijalne entropije funkcije gustine verovatnoće kontekstualnih vektora i odslikava postojanje nepovezanih značenja (homonimija). U skladu sa predviđanjima, na skupu polisemičnih imenica srpskog jezika, zabeležen je samo efekat entropije ekvivalentne Gausove distribucije. Negentropija nije imala uticaj na vreme reakcije. Ovaj nalaz je u skladu sa pretpostavkom da entropija ekvivalentne Gausove distribucije, kao mera širine aktivacije u semantičkom prostoru, odslikava polisemiju, odnosno prisustvo povezanih značenja reči. Stoga se prednost u obradi polisemičnih reči može objasniti širokom aktivacijom u semantičkom prostoru i smanjenom kompeticijom među Gausovim distribucijama koje se preklapaju u velikoj meri., Previous research demonstrated that processing time was facilitated by number of related word senses (polysemy) and inhibited by number of unrelated word meanings (homonymy). The starting point of this research were the findings described by Moscoso del Prado Martín and colleagues, who offered a unique account of processing of two forms of lexical ambiguity. By applying the techniques they proposed, for the set of strictly polysemous Serbian nouns we calculated ambiguity measures they introduced. Based on the covariance matrix of the context vectors, we derived entropy of equivalent Gaussian distribution, and based on the context vectors probability density function, we derived differential entropy. Negentropy was calculated as the difference between the two. Based on interpretation that entropy of equivalent Gaussian mirrors sense cooperation, or polysemy, while negentropy mirrors meaning competition, or homonymy, we predicted that in the set of strictly polysemous nouns, negentropy effect would disappear. In accordance with our predictions, entropy of equivalent Gaussian distribution accounted for significant proportion of processing latencies variance. Negentropy did not affect reaction time. This finding is in accordance with the hypothesis that entropy of equivalent Gaussian distribution, as a measure of general width of activation in semantic space, reflects polysemy, that is, the existence of related senses. Therefore, polysemy advantage could be the result of the wide-spread activation in semantic space and reduced competition among overlapping Gaussians.", publisher = "Društvo psihologa Srbije, Beograd", journal = "Psihologija", title = "Vektorski zasnovana semantička analiza polisemičnih reči, Vector based semantic analysis reveals absence of competition among related senses", pages = "106-95", number = "1", volume = "42", doi = "10.2298/PSI0901095F" }
Filipović Đurđević, D., Đurđević, Đ.,& Kostić, A.. (2009). Vektorski zasnovana semantička analiza polisemičnih reči. in Psihologija Društvo psihologa Srbije, Beograd., 42(1), 95-106. https://doi.org/10.2298/PSI0901095F
Filipović Đurđević D, Đurđević Đ, Kostić A. Vektorski zasnovana semantička analiza polisemičnih reči. in Psihologija. 2009;42(1):95-106. doi:10.2298/PSI0901095F .
Filipović Đurđević, Dušica, Đurđević, Đorđe, Kostić, Aleksandar, "Vektorski zasnovana semantička analiza polisemičnih reči" in Psihologija, 42, no. 1 (2009):95-106, https://doi.org/10.2298/PSI0901095F . .