Skip to main content
Пријава

Collected Item: “Multi-word Expressions for Abusive Speech Detection in Serbian”

Врста публикације

Рад у зборнику

Верзија документа

рецензирана

Језик

енглески

Аутор/и (Милан Марковић, Никола Николић)

Ranka Stanković, Jelena Mitrović, Danka Jokić, Cvetana Krstev

Наслов рада (Наслов - поднаслов)

Multi-word Expressions for Abusive Speech Detection in Serbian

Назив конференције (зборника), место и датум одржавања

Proceedings of the Joint Workshop on Multiword Expressions and Electronic Lexicons

Уредник/ци зборника

Stella Markantonatou et al

Издавач (Београд : Просвета)

Association for Computational Linguistics

Година издавања

2020

Сажетак рада на српском језику

Ovaj rad predstavlja istraživanja na usavršavanju i unapređenju srpske verzije rečnika Hurtlex, višejezičnog leksikona uvredljivih reči. Posebnu pažnju posvećujemo dodavanju izraza sa više reči (polileksemskih jedinica) koji se mogu smatrati uvredljivim, jer su takvi leksički zapisi veoma važni za postizanje dobrih rezultata u mnoštvu zadataka otkrivanja uvredljivog jezika. Srpski morfološki rečnici se koriste kao osnova za čišćenje podataka i stvaranje rečnika. Istaknuta je veza sa drugim leksičkim i semantičkim resursima na srpskom jeziku i predviđena je izgradnja sistema za otkrivanje uvredljivog jezika zasnovanog na tom resursu.

Сажетак рада на енглеском језику

This paper presents our work on the refinement and improvement of the Serbian language part of Hurtlex, a multilingual lexicon of words to hurt. We pay special attention to adding Multi-word expressions that can be seen as abusive, as such lexical entries are very important in obtaining good results in a plethora of abusive language detection tasks. We use Serbian morphological dictionaries as a basis for data cleaning and MWE dictionary creation. A connection to other lexical and semantic resources in Serbian is outlined and building of abusive language detection systems based on that connection is foreseen.

Почетна страна рада

74

Завршна страна рада

84

Кључне речи на српском (одвојене знаком ", ")

uvredljiv govor, govor mržnje, leksički izvori, višejezični leksikon, izrazi sa više reči

Кључне речи на енглеском (одвојене знаком ", ")

abusive speech, hate-speech, lexical resources, multilingual lexicon, multi-word expressions

Линк

https://www.aclweb.org/anthology/2020.mwe-1.10.pdf

Шира категорија рада према правилнику МПНТ

М30

Ужа категорија рада према правилнику МПНТ

М33

Ниво приступа

Отворени приступ

Лиценца

Creative Commons – Attribution-Share Alike 4.0 International

Формат датотеке

.pdf
Click here to view the corresponding item.