Претрага
47 items
-
Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++
Branislava Šandrih, Ranka Stanković (2020)U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu ...... resources. LeXimir consists of two modules for the terminology extraction. The first module is a rule-based system re- lying on e-dictionaries and local grammars developed in Unitex,6 that are implemented as finite-state transducers (FST). The second module implements various statistical measures used for ...Branislava Šandrih, Ranka Stanković. "Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.6
-
Using English Baits to Catch Serbian Multi-Word Terminology
In this paper we present the first results in bilingual terminology extraction. The hypothesis of our approach is that if for a source language domain terminology exists as well as a domain aligned corpus for a source and a target language, then it is possible to extract the terminology for a target language. Our approach relies on several resources and tools: aligned domain texts, domain terminology for a source language, a terminology extractor for a target language, and a ...aligned texts, word alignment, terminology extraction, electronic dictionaries, morphological inflection... MWT. 4.3. The rule-based system for the terminology extraction The approach to terminology extraction for Serbian based on e-dictionaries and local grammars described in (Stankovic et al., 2016) was improved with additional syntactic patterns in order to cover as many terminology structures as possible ...Cvetana Krstev, Branislava Šandrih, Ranka Stanković. "Using English Baits to Catch Serbian Multi-Word Terminology" in Proceedings of the 11th International Conference on Language Resources and Evaluation, LREC 2018, Miyazaki, Japan, May 7-12, 2018, European Language Resources Association (ELRA) (2018)
-
SrpELTeC: A Serbian Literary Corpus for Distant Reading
U članku je predstavljen SrpELTeC, korpus razvijen u okviru akcije COST Distant Reading for European Literary History (CA16204). Svi romani u SrpELTeC-u su odabrani, pripremljeni i obeleženi korišćenjem zajedničkih principa uspostavljenih za sve jezičke zbirke u Evropskoj zbirci književnog teksta (ELTeC). Navedeni su izazovi i rešenja u pripremi SrpELTeC od nule. Svi romani su ručno kodirani u TEI sa bogatim metapodacima i strukturnim napomenama. Automatska anotacija je uključivala POS-označavanje, lematizaciju i imenovane entitete, oslanjajući se na resurse za obradu ...digital humanities, Serbian literature, text corpora, distant reading , linked data, named entity recognition, text analyticsRanka Stanković, Cvetana Krstev, Duško Vitas. "SrpELTeC: A Serbian Literary Corpus for Distant Reading" in Primerjalna književnost, Research Centre of the Slovenian Academy of Sciences and Arts (2024). https://doi.org/10.3986/pkn.v47.i2.03
-
Bilingual lexical extraction based on word alignment for improving corpus search
Jelena Andonovski, Branislava Šandrih, Olivera Kitanović. "Bilingual lexical extraction based on word alignment for improving corpus search" in The Electronic Library, Emerald (2019). https://doi.org/10.1108/EL-03-2019-0056
-
A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian
Uvredljivi govor na društvenim medijima, uključujući psovke, pogrdni govor i govor mržnje, dostigao je nivo pandemije. Sistem koji bi bio u stanju da detektuje takve tekstove mogao bi da pomogne da internet i društveni mediji postanu bolji virtuelni prostor sa više poštovanja. Istraživanja i komercijalna primena u ovoj oblasti do sada su bili fokusirani uglavnom na engleski jezik. Ovaj rad predstavlja rad na izgradnji AbCoSER-a, prvog korpusa uvredljivog govora na srpskom jeziku. Korpus se sastoji od 6.436 ručno označenih ...... behaviour that are the result of national, racial, or religious hatred and intolerance. The system relied on electronic dictionaries of Serbian and local grammars that covered various patterns of hate speech and ways they were covered in newspaper articles. It should be noted that the focus of this research ...Danka Jokić, Ranka Stanković, Cvetana Krstev, Branislava Šandrih. "A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian" in 3rd Conference on Language, Data and Knowledge (LDK 2021), MDPI AG (2021). https://doi.org/10.4230/OASIcs.LDK.2021.13
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... Krstev, Cvetana, Ranka Stanković, Ivan Obradović, and Biljana Lazić. 2015. “Terminology Acquisition and Description Using Lexical Resources and Local Grammars.” In Proceedings of the 11th International Conference on Terminology and Artificial Intelligence, edited by Thierry Poibeau and Pamela Faber ...
... deskriptivnom logikom. Metoda koju su predložili koristi 57 delimične sintaksičke strukture koje obezbeđuje LTAG parser (Lexical Tree Adjoining Grammars) za identifikovanje koncepata kandidata, kao i mehanizam zaključivanja (pravila) deskriptivne logike za predstavljanje znanja. Predložena metodologija ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Споменица 1991. – 2015. година: 135 година геологије и 70 година рударства на Универзитету у Београду
... of Belgrade, Academic Mind, pp. 119–129. KRSTEV C., OBRADOVIĆ I., UTVIĆ M. & VITAS D., 2014: A System for Named Entity Recognition Based on Local Grammars. Journal of Logic and Compu- tation, Vol. 24, No. 2, pp. 473–489. STANKOVIĆ R., OBRADOVIĆ I., UTVIĆ M., 2014: “Developing Termbases for Expert ...
... 1007/978-3-319-27932-9. KRSTEV C., STANKOVIĆ R., OBRADOVIĆ I., LAZIĆ B., 2015: Terminology acquisition and description using lexical resources and local grammars. Proceedings of the 11th Conference on Terminology and Artificial Intelligence, CEUR Workshop Proceedings, Granada, Spain, Thierry Poibeau and ...
... Bi28V8O62, Journal of Solid State Chemistry, 2014. 261. Krstev C., Obradović I., Utvić M., Vitas D.: A System for Named Entity Reco- gnition Based on Local Grammars, Journal of Logic and Computation, 2014. 262. Milutinović A., Ganić A., Tokalić R.: Accuracy assessment of geometrical elements for setting-out ...главни и одговорни уредник Душан Поломчић. Споменица 1991. – 2015. година: 135 година геологије и 70 година рударства на Универзитету у Београду, Београд : Универзитет у Београду, Рударско-геолошки факултет, 2016