Претрага
85 items
-
Upotreba lidar tehnologije i digitalne fotogrametrije primenom iPhone pametnih telefona na primeru rudnika "Rudnik"
Nikola Mirković, Luka Crnogorac, Aleksa Paunović. "Upotreba lidar tehnologije i digitalne fotogrametrije primenom iPhone pametnih telefona na primeru rudnika "Rudnik"" in 15. Simpozijum „Rudarstvo 2024“ Održivi razvoj u rudarstvu i energetici, Vrnjačka banja, 21-24. maj 2024., Beograd : Institut za tehnologiju nuklearnih i drugih mineralnih sirovina (2024)
-
An Approach to Efficient Processing of Multi-Word Units
Efficient processing of Multi-Word Units in the course of development of morphological MWU dictionaries is not easy to achieve, especially when languages with complex morphological structures are concerned, such as Serbian. Manual development of this type of dictionaries is a tedious and extremely slow process. To alleviate this problem we turned to our multipurpose software tool, dubbed LeXimir, in the production of lemmas for e-dictionaries of multi-word units. In addition to that, we developed a procedure aimed at making ...... Cvetana Krstev, Ivan Obradović, Ranka Stanković, Duško Vitas Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] An Approach to Efficient Processing of Multi-Word Units | Cvetana Krstev, Ivan Obradović, Ranka Stanković, Duško Vitas | Computational Linguistics - Applications ...Cvetana Krstev, Ivan Obradović, Ranka Stanković, Duško Vitas. "An Approach to Efficient Processing of Multi-Word Units" in Computational Linguistics - Applications, Studies in Computational Intelligence 458 no. 458, Berlin Heidelberg : Springer-Verlag (2013): 109-129. https://doi.org/10.1007/978-3-642-34399-5_6
-
Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names
In this paper we present a rule- and lexicon-based system for the recognition of Named Entities (NE) in Serbian news paper texts that was used to prepare a gold standard annotated with personal names. It was further used to prepare training sets for four different levels of annota tion, which were further used to train two Named Entity Recognition (NER) sys tems: Stanford and spaCy. All obtained models, together with a rule- and lexicon based system were evaluated on ...... tion Systems. In Proceedings of the Sixth Named Entity Workshop, joint with 54th ACL. pages 21–27. Cvetana Krstev, Ivan Obradović, Miloš Utvić, and Duško Vitas. 2014. A System for Named En- tity Recognition Based on Local Grammars. Jour- nal of Logic and Computation 24(2):473–489. https://doi.org/10. ...
... Serbian Daily Press]. Knjižen- stvo - časopis za studije književnosti, roda i kulture V. https://doi.org/10.18485/knjiz.2015.1.24. Cvetana Krstev, Duško Vitas, and Sandra Gucul. 2005. Recognition of Personal Names in Serbian Texts. In International Conference Recent Advances in Natu- ral Language Processing ...
... and Juníchi Tsu- jii. 2012. BRAT: a Web-based Tool for NLP- Assisted Text Annotation. In Proceedings of the Demonstrations Session at EACL 2012. Duško Vitas and Cvetana Krstev. 2012. Processing of Corpora of Serbian using Electronic Dictionaries. Prace Filologiczne LXIII:279–292. ...Branislava Šandrih, Cvetana Krstev, Ranka Stanković. "Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names" in Proceedings - Natural Language Processing in a Deep Learning World, Incoma Ltd., Shoumen, Bulgaria (2019). https://doi.org/10.26615/978-954-452-056-4_122
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... које у истраживању оваквих тема нуди приказани приступ заснован на електронским речницима и локалним граматикама. Литература 1. ВИТАС И ДР. 2012: Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. Српски језик у дигиталном добу -- The Serbian ...
... описи примене, 43(3), стр. 51- 59, Међународни славистички центар, Београд. 3. ВУЈИЧИЋ СТАНКОВИЋ И ДР. 2014: Staša Vujičić Stanković, Cvetana Krstev, Duško Vitas, “Enriching Serbian WordNet and Electronic Dictionaries with Terms from the Culinary Domain”, In The Proceedings of Seventh Global WordNet ...
... Electronic dictionaries. Belgrade: Faculty of Philology, University of Belgrade. 9. КРСТЕВ И ДР. 2014: Cvetana Krstev, Staša Vujičić Stanković, Duško Vitas, “Approximate Measures in the Culinary Domain: Ontology and Lexical Resources”, in Proceedings of the 9th Language Technologies Conference ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)
-
Multi-word Expressions for Abusive Speech Detection in Serbian
Ovaj rad predstavlja istraživanja na usavršavanju i unapređenju srpske verzije rečnika Hurtlex, višejezičnog leksikona uvredljivih reči. Posebnu pažnju posvećujemo dodavanju izraza sa više reči (polileksemskih jedinica) koji se mogu smatrati uvredljivim, jer su takvi leksički zapisi veoma važni za postizanje dobrih rezultata u mnoštvu zadataka otkrivanja uvredljivog jezika. Srpski morfološki rečnici se koriste kao osnova za čišćenje podataka i stvaranje rečnika. Istaknuta je veza sa drugim leksičkim i semantičkim resursima na srpskom jeziku i predviđena je izgradnja sistema za ...... 106–112. Cvetana Krstev, Sandra Gucul, Duško Vitas, and Vanja Radulović. 2007. Can we make the bell ring? In Proceedings of the Workshop on a Common Natural Language Processing Paradigm for Balkan Languages, pages 15–22. Cvetana Krstev, Jelena Jaćimović, and Duško Vitas. 2020. Analysis of similes in ...
... in a wordnet. In Proceedings of Eighth Global WordNet Conference, pages 218–225. 84 Miljana Mladenović, Jelena Mitrović, Cvetana Krstev, and Duško Vitas. 2016b. Hybrid sentiment analysis frame- work for a morphologically rich language. Journal of Intelligent Information Systems, 46(3):599–620. ...Ranka Stanković, Jelena Mitrović, Danka Jokić, Cvetana Krstev. "Multi-word Expressions for Abusive Speech Detection in Serbian" in Proceedings of the Joint Workshop on Multiword Expressions and Electronic Lexicons, Association for Computational Linguistics (2020)
-
Using Lexical Resources for Irony and Sarcasm Classification
The paper presents a language dependent model for classification of statements into ironic and non-ironic. The model uses various language resources: morphological dictionaries, sentiment lexicon, lexicon of markers and a WordNet based ontology. This approach uses various features: antonymous pairs obtained using the reasoning rules over the Serbian WordNet ontology (R), antonymous pairs in which one member has positive sentiment polarity (PPR), polarity of positive sentiment words (PSP), ordered sequence of sentiment tags (OSA), Part-of-Speech tags of words (POS) ...... Human Language Technologies: short papers – Volume 2. Association for Computational Linguistics, 564–568. [10] Matthieu Constant, Cvetana Krstev, and Duško Vitas. 2015. Hybrid Lexical Tagging in Serbian. In Proc. of 7th Language & Technology Conference. Fundacja Uniwersytetu im. A. Mickiewicza, Poznań, ...
... on Natural Language Processing of the Asian Federation of NLP (ACL 2015). Volume 2: Short Papers, 644–650. [20] Svetla Koeva, Cvetana Krstev, and Duško Vitas. 2008. Morpho-semantic relations in Wordnet – a case study for two Slavic languages. In Global Wordnet Conference (GWC’08). University of Szeged ...
... Mišković. 2001. The particle baš in contemporary Serbian. Pragmatics 11, 1 (2001), 17–30. [24] Miljana Mladenović, Jelena Mitrović, Cvetana Krstev, and Duško Vitas. 2015. Hy- brid sentiment analysis framework for a morphologically rich language. Journal of Intelligent Information Systems 46, 3 (2015), 599–620 ...Miljana Mladenović, Cvetana Krstev, Jelena Mitrović, Ranka Stanković. "Using Lexical Resources for Irony and Sarcasm Classification" in Proceedings of the 8th Balkan Conference in Informatics (BCI '17), New York, NY, USA, : ACM (2017). https://doi.org/
-
Simulation of Hydrogeological Environmental Discharge in Case of Interruption Constant Observations
Marina Čokorilo Ilić, Dragoljub Bajić, Miroslav Popović. "Simulation of Hydrogeological Environmental Discharge in Case of Interruption Constant Observations" in International Scientific Conference - Sinteza 2024, Belgrade, 16. maj 2024, Singidunum University (2024). https://doi.org/10.15308/Sinteza-2024-288-294
-
Serbian NER&Beyond: The Archaic and the Modern Intertwinned
U ovom radu predstavljamo srpski književni korpus koji se razvija pod okriljem COST Akcije „Distant Reading for European Literary History” CA16204. Koristeći ovaj korpus romana napisanih pre više od jednog veka, razvili smo i učinili javno dostupnim Sistem za prepoznavanje imenovanih entiteta (NER) obučen da prepozna 7 različitih tipova imenovanih entiteta, sa konvolucionom neuronskom mrežom (CNN), koja ima F1 rezultat od ≈91% na test skupu podataka. Ovaj model je dalje ocenjen na posebnom skupu podataka za evaluaciju. Završavamo poređenje ...... Loránd Univer- sity. http://elte-dh.hu/wp-content/uploads/ 2019/09/DH_BP_2019-Abstract-Booklet.pdf. Cvetana Krstev, Ivan Obradović, Miloš Utvić, and Duško Vitas. 2014. A System for Named Entity Recognition Based on Local Grammars. Journal of Logic and Computation, 24(2):473–489. Cvetana Krstev and Ranka ...
... Fronti- ni, Tomaz Erjavec, and Carmen Brando. 2019. Named Entity Recognition for Distant Reading in Several European Literatures. In DH Buda- pest 2019. Duško Vitas and Cvetana Krstev. 2012. Processing of Corpora of Serbian Using Electronic Dictiona- ries. Prace Filologiczne, 63:279–292. Branislava Šandrih ...Branislava Šandrih Todorović, Cvetana Krstev, Ranka Stanković, Milica Ikonić Nešić. "Serbian NER&Beyond: The Archaic and the Modern Intertwinned" in Proceedings of the Conference Recent Advances in Natural Language Processing - Deep Learning for Natural Language Processing Methods and Applications, INCOMA Ltd. Shoumen, BULGARIA (2021). https://doi.org/10.26615/978-954-452-072-4_141
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... Joachim Schöpfel (ур.). Grey Literature in Library and Information Studies. Amsterdam: Walter de Gruyter, 2010. 1-9. Krstev, Cvetana, Ranka Stanković, Duško Vitas, Ivan Obradović. “The Usage of Various Lexical Resources and Tools to Improve the Performance of Web Search Engines”. Sixth International Conference ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци ...Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... Confer- ence on Language Resources and Evaluation, LREC 2016, Portorož, Slov- enia, pp. 23–28. Крстев и др. 2016: Cvetana Krstev, Anđelka Zečević, Duško Vitas, and Tita Kyriacopoulou, “NERosettafor the Named Entity Multi-lingual Space”, In: Human Language Technology Challenges for Computer Science ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Using English Baits to Catch Serbian Multi-Word Terminology
In this paper we present the first results in bilingual terminology extraction. The hypothesis of our approach is that if for a source language domain terminology exists as well as a domain aligned corpus for a source and a target language, then it is possible to extract the terminology for a target language. Our approach relies on several resources and tools: aligned domain texts, domain terminology for a source language, a terminology extractor for a target language, and a ...aligned texts, word alignment, terminology extraction, electronic dictionaries, morphological inflection... Serbian) nor we lemmatize and POS-tag text. Instead we use shallow parsing relying on extensive morphological e-dictionaries of Serbian (Cvetana Krstev, Duško Vitas, 2015) that not only helps to identify terminology precisely, but also enables production of cor- rect MWT lemmas and consequently all its inflected ...
... Hans Uszkoreit (Series Editors). Springer. Available online at http://www.meta-net.eu/whitepapers. 8. Language Resource References Cvetana Krstev, Duško Vitas. (2015). Serbian Morpho- logical Dictionary - SMD. University of Belgrade, HLT Group and Jerteh, Lexical resource, 2.0. Cvetana Krstev. (2013) ...Cvetana Krstev, Branislava Šandrih, Ranka Stanković. "Using English Baits to Catch Serbian Multi-Word Terminology" in Proceedings of the 11th International Conference on Language Resources and Evaluation, LREC 2018, Miyazaki, Japan, May 7-12, 2018, European Language Resources Association (ELRA) (2018)
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... Digital Age Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Српски језик у дигиталном добу -- The Serbian Language in the Digital Age | Duško Vitas, Ljubomir ...
... књига СРПСКИ ЈЕЗИК У ДИГИТАЛНОМ ДОБУ Duško Vitas Ljubomir Popović Cvetana Krstev Ivan Obradović Gordana Pavlović-Lažetić Mladen Stanojević White Paper Series THE SERBIAN LANGUAGE IN THE DIGITAL AGE Серија белих књига СРПСКИ ЈЕЗИК У ДИГИТАЛНОМ ДОБУ Duško Vitas University of Belgrade Ljubomir ...
... of Sciences: Radovan Garabík Словенија Slovenia Jožef Stefan Institute: Marko Grobelnik Србија Serbia Univ. of Belgrade, Faculty of Mathematics: Duško Vitas, Cvetana Krstev, Ivan Obradović Pupin Institute: Sanja Vraneš Финска Finland Computational Cognitive Systems Research Group, Aalto Univ.: Timo ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Development of Open Educational Resources (OER) for Natural Language Processing
In this paper we present the development of an online course at the edX BAEKTEL platform named “Lexical Recognition in the Natural Language Processing (NLP)”. It is based on the course of the same name for PhD studies at the University of Belgrade, Faculty of Philology. There are not many courses in Computational Linguistics (CL) on OER platforms, and there is none in Serbian either for CL or NLP. We have developed this course in order to improve this ...... of information.[5] Computational Linguistics started to attract attention of researchers in Serbia more than 35 years ago when Professor Duško Vitas initiated the interest in CL as a research field in Serbia, broadened its influence, and established the group of interested researchers. ...Cvetana Krstev, Biljana Lazić, Ranka Stanković, Giovanni Schiuma, Miladin Kotorčević. "Development of Open Educational Resources (OER) for Natural Language Processing" in The Sixth International Conference on e-Learning (eLearning-2015), September 2015, Belgrade, Serbia, Belgrade : Belgrade Metropolitan Univesity (2015)
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... program for aligning sentences in bilingual corpora, Computational Linguistics”, Vol. 19/1, pp. 75 – 102. 12 [3] Krstev Cvetana, Ranka Stanković, Duško Vitas, Ivan Obradović (2006): “WS4LR - a Worksation for Lexical Resources”, in Proceedings of the Fifth International Conference on Language Resources ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian
Ovaj rad predstavlja novi jezički resurs za pretraživanje i istraživanje verbalnih aspektnih parova u BCS (bosanskom, hrvatskom i srpskom), kreiran korišćenjem principa Lingvističkih Povezanih Otvorenih Podataka (LLOD). Pošto ne postoji resurs koji bi pomogao učenicima bosanskog, hrvatskog i srpskog kao stranih jezika da prepoznaju aspekt glagola ili njegove parove, kreirali smo novi resurs koji će korisnicima pružiti informacije o aspektu, kao i link ka aspektnim parovima glagola. Ovaj resurs takođe sadrži spoljne linkove ka monolingvalnim rečnicima, Wordnetu i BabelNetu. ...Ranka Stanković, Maxim Ionov, Medina Bajtarević, Lorena Ninčević. "OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... Bulgarian Academy of Sciences. Krstev, Cvetana, Duško Vitas, and R Stanković. 2015. “A Lexical Approach to Acronyms and Their Definitions.” In Proceedings of the 7th Language & Technology Conference, 219–23. Krstev, Cvetana, An\djelka Zečević, Duško Vitas, and Tita Kyriacopoulou. 2013. “NERosetta for ...
... Development Environment for Semantic Web Applications.” In International Semantic Web Conference, 229–43. Springer. Koeva, Svetla, Cvetana Krstev, and Duško Vitas. 2008. “Morpho-Semantic Relations in Wordnet–a Case Study for Two Slavic Languages.” In Proceedings of Global WordNet Conference 2008, 239–53 ...
... Pamela Faber, 1495:81–89. CEUR Workshop Proceedings. CEUR-WS.org. http://ceur-ws.org/Vol-1495/paper_13.pdf. Krstev, Cvetana, Ranka Stanković, and Duško Vitas. 2018. “Knowledge and Rule-Based Diacritic Restoration in Serbian.” In Proceedings of the Third International Conference Computational Linguistics ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Развој геолошког терминолошког речника ГеолИССТерм
... termina i pojmova geološkog informacionog sistema Srbije, ministarstvo životne sredine, rudarstva i prostornog planiranja republike Srbije. vitas, Duško. Pavlović-lažetić, goradana. krstev, cvetana. Popović, ljuba. Obradović, Ivan. 2003: Processing Serbian Written Texts: An Overview of resources ...Ranka Stanković, Branislav Trivić, Olivera Kitanović, Branislav Blagojević, Velizar Nikolić. "Развој геолошког терминолошког речника ГеолИССТерм" in INFOteka: časopis za informatiku i bibliotekarstvo, Beograd : Zajednica biblioteka univerziteta u Srbiji (2011)
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... 993–1022. Белић 1959: Александар Белић, „Увод”, речник српскохрватског књижевног и народног језика сану, Београд: САНУ, VII‒XXVI. Витас/Крстев 2012: Duško Vitas & Cvetana Krstev, Processing of Corpora of Serbian Using Electronic Dictionaries. Prace Filologiczne, vol. LXIII, Warszawa, 279–292. Вулов ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian
Uvredljivi govor na društvenim medijima, uključujući psovke, pogrdni govor i govor mržnje, dostigao je nivo pandemije. Sistem koji bi bio u stanju da detektuje takve tekstove mogao bi da pomogne da internet i društveni mediji postanu bolji virtuelni prostor sa više poštovanja. Istraživanja i komercijalna primena u ovoj oblasti do sada su bili fokusirani uglavnom na engleski jezik. Ovaj rad predstavlja rad na izgradnji AbCoSER-a, prvog korpusa uvredljivog govora na srpskom jeziku. Korpus se sastoji od 6.436 ručno označenih ...... Véronis. Visualising a text with a tree cloud. In ClassiĄcation as a Tool for Research, pages 561–569. Springer, 2010. 18 Cvetana Krstev, Sandra Gucul, Duško Vitas, and Vanja Radulović. Can we make the bell ring? In Proceedings of the Workshop on a Common Natural Language Processing Paradigm for Balkan Languages ...Danka Jokić, Ranka Stanković, Cvetana Krstev, Branislava Šandrih. "A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian" in 3rd Conference on Language, Data and Knowledge (LDK 2021), MDPI AG (2021). https://doi.org/10.4230/OASIcs.LDK.2021.13