Alagić, Domagoj

Representing word meaning with lexical substitutes : doctoral thesis / mentor Jan Šnajder - Zagreb : D. Alagić, Faculty of electrical engineering and computing, 2021. - ix, 73 str. : ilustr. ; 30 cm + CD

Bibliografija str. 61-67.

Ova disertacija usredotočena je na istraživanje računalnih pristupa predstavljanju značenja riječi u kontekstu, specifično na one zasnovane na leksičkim zamjenama (LZ), riječima koje mogu zamijeniti određenu riječ u kontekstu, a da pritom ne promijene značenje rečenice. Disertacija detaljno istražuje koliko predstavljanje značenja zasnovano na leksičkim zamjenama korespondira s ustaljenim pristupima predstavljanju značenja riječi putem smislova. Najprije je predstavljena studija provjere koncepta s ciljem provjere početne pretpostavke koja govori da su leksičke zamjene prikladne za predstavljanje značenja riječi. Ova studija provedena je na zadatku indukcije značenja riječi (IZR), ustaljenome semantičkom zadatku obrade prirodnog jezika (OPJ). Rezultati ostvareni metodama zasnovanim na leksičkim zamjenama motivirali su detaljniju studiju o korespondenciji između različitih metoda predstavljanja značenja riječi. Ova disertacija također uvodi novi skup podataka označen smislovima riječi i leksičkim zamjenama. Dodatno, provedena je i fokusirana studija o leksičkoj zamjeni za hrvatski jezik, iz koje je proizašao i prvi skup podataka za leksičku zamjenu na hrvatskome jeziku. The thesis focuses on exploring computational approaches to representing word meaning in context, specifically those based on lexical substitutes (LS), meaning-preserving replacements for a word in context. The thesis explores in-depth to what extent computational substitute-based representation corresponds to the more established sense-based representation. First, a proof-of-concept study aimed to validate the initial hypothesis of lexical substitutes being suitable for representing word meaning is presented. The study tests this hypothesis on word sense induction (WSI), a well-established semantic natural language processing (NLP) task. The results obtained using methods based on lexical substitutes motivated the more detailed study on the correspondence between different meaning representations. The thesis also introduces a new dataset annotated with both word senses and lexical substitutes. Additionally, a focused study on lexical substitution for the Croatian language was also performed, yielding the first Croatian lexical substitution dataset.

Središnja knjižnica Fakulteta elektrotehnike i računarstva, Unska 3, 10000 Zagreb
tel +385 1 6129 886 | fax +385 1 6129 888 | ferlib@fer.hr