Collected Item: “Повезивање лексема морфолошких речника коришћењем базе Лексимирка”
Врста публикације
Рад у зборнику
Верзија документа
објављена
Језик
српски
Аутор/и (Милан Марковић, Никола Николић)
Биљана Рујевић, Ранка Станковић, Михаило Шкорић
Наслов рада (Наслов - поднаслов)
Повезивање лексема морфолошких речника коришћењем базе Лексимирка
Назив конференције (зборника), место и датум одржавања
Модерни речници у функцији просечнога корисника: стари проблеми, савремени правци и нови изазови, Лексикографски сусрети, Београд, 27-29. мај 2024.
Уредник/ци зборника
Саша Марјановић
Издавач (Београд : Просвета)
Београд : Филолошки факултет
Година издавања
2024
Сажетак рада на српском језику
Рад приказује приступ успостављању повезивања лексема у Морфолошким речницима српског језика. Повезивање, тј. успостављање релација не би било могуће без претходне конверзије речника из облика текстуалних датотека у облик лексичке базе података назване Лексимирка. Методологија за успостављање релација почива на 69 појединачних релација заснованих на 388 правила. Правила за повезивање се дефинишу на основу обележја лексичких записа (врсте речи, маркера, граматичких категорија и подниски). Успостављене релације су крајњем кориснику видљиве путем апликације Лексимирка у форми хипервеза и могу се сврстати у три врсте: варијационе, деривационе и изговорне релације. Варијационим релацијама су повезане лексеме које међусобно представљају варијантне облике (нпр. кафа и кава, евро и еуро). У деривационе релације спадају везе међу лексемама које су повезане деривационим правилима (нпр. колач и колачић, дугме и дугменце). Изговорном релацијом су повезани облици речи екавског и ијекавског изговора (нпр. бијел и бео, сњешко и снешко). Остварено је укупно 103.589 повезивања лексичких записа (кроз 43 варијационе релације остварено 3.401 повезивање, кроз 25 деривационих релација 94.732 повезивања и једну изговорну релацију 5.456 повезивања).
Сажетак рада на енглеском језику
The paper presents an approach to establishing relations between lexemes in Serbian Morphological Dictionaries (SMD). These relations would not be possible without the prior conversion of the SMD dictionaries from text file formats into a lexical database — Leximirka. The methodology consists of 69 relations defined by 388 different rules that are based on lexical entry properties such as part of speech, markers, grammatical features, and substrings. The established relations are visible to the end user through the application of the same name (Leximirka) in the form of hyperlinks and can be categorized into three types: variational, derivational, and pronunciation relations. Variational relations connect lexemes representing variant forms of each other, such as kafa and kava (coffee), euro and evro (euro), etc. Derivational relations include connections between lexemes linked by derivational rules (e.g., kolač (cake) and kolačić (cookie), dugme (button) and dugmence (little button)). Pronunciation relations connect word forms used in the ekavian and ijekavian pronunciations, such as bijel and beo (white) or snješko and sneško (snowman). Using these relations, 103,589 lexical entries pairs are established (3,401 using 43 variational relations, 94,732 using 25 derivational relations and 5,456 using 1 pronunciation relation).
Почетна страна рада
273
Завршна страна рада
283
DOI број
10.18485/lexicog_meet.2024.1.ch23
ISBN број изворне публикације
978-86-6153-758-5
Кључне речи на српском (одвојене знаком ", ")
морфолошки речници, повезивање лексема, лексичка база података, српски језик
Кључне речи на енглеском (одвојене знаком ", ")
morphological dictionaries, lexeme connection, lexical database, Serbian language
Шира категорија рада према правилнику МПНТ
М30
Ужа категорија рада према правилнику МПНТ
М33
Пројект у склопу кога је настао рад
Grant No. 7276, (Text Embeddings - Serbian Language Application – TESLA)
Ниво приступа
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат датотеке
.pdf