Претрага
125 items
-
SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian
Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković (2019)У овом раду представљамо модел за избор добрих примера за речник српског језика и развој иницијалних компоненти модела. Метода која се користи заснива се на детаљној анализи различитих лексичких и синтактичких карактеристика у корпусу састављених од примера из пет дигитализованих свезака речника САНУ. Почетни скуп функција био је инспирисан сличним приступом и за друге језике. Дистрибуција карактеристика примера из овог корпуса упоређује се са карактеристиком дистрибуције узорака реченица ексцерпираних из корпуса који садрже различите текстове. Анализа је показала да ...Српски, добри примери из речника, аутоматизација израде речника, издвајање својстава, Машинско учење... osavremenjivanja izrade rečnika na primeru 268 Proceedings of eLex 2019 Rečnika srpskohrvatskog književnog i narodnog jezika SANU i Instituta za srpskohrvatski jezik. In IV međunarodni naučni skup „Računarska obrada jezičkih podataka”, Portorož: Institut Jožef Stefan, pp. 375–384 [Possibility ...
... for Serbo-Croatian]. SASA Dictionary: Речник српскохрватског књижевног и народног језика САНУ, I–XX (The Dictionary of the Serbo-Croatian Standard and Vernacular Language) (1959–2017). Београд: Институт за српски језик САНУ и САНУ. Stanković, R., Krstev, C., Vitas, D., Vulović, N. & Kitanović, O. ...
... [Izgradnja referentnog korpusa savremenog srpskog jezika] (Doctoral dissertation, University of Belgrade). Vitas D. & Krstev C. (2015). Blueprint for the computerized dictionary of the Serbian language [Nacrt za informatizovani rečnik srpskog jezika]. Naučni sastanak slavista u Vukove dane, 44(3) ...Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković. "SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian" in Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference , Lexical Computing CZ, s.r.o. (2019)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... српске електронске речнике | Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић | Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене | 2017 | | 10.18485/msc.2017.46.3.ch10 http://dr.rgf.bg.ac.rs/s/repo/item/0002015 Дигитални репозиторијум ...
... семантичке класе информација. У овом раду посебна пажња је посвећена текстовима из једног специфичног техничког домена, конкретно рударства. За српски језик је развијен систем за препознавање именованих ентитета (Крстев и др., 2013), заснован на правилима, који ус- пешно препознаје различите типове именованих ...
... м аутомата са сложенијим захтевима. Пример истраживања у коме су коришћени маркери у циљу екстракције глагола из кулинарског до- мена за српски језик дат је у (Крстев/Лазић, 2015). Један други пример употре- бе маркера јесте систем за екстракцију именованих ентитета НЕР осета (нази- ва установа ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... ROmeka@RGF унапређено је имплементирањем проширених упита. Коришћени су веб сервиси (Станковић и др. 2012) и морфолошки електронски речници за српски језик (Крстев и др. 2008, Станковић 152 BIBLIOINFO и др. 2016) за морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/ vebran/api/delafs/ključna_reč) ...
... изводљивости, концептуална студија, студија утицаја затеченог стања и студија утицаја на животну средину врсте студије. 12 Web Ontology Language – OWL је језик за представљање онтологија. 13 Protege је програм за управљање онтологијама. Више на: https://protege. stanford.edu/ 156 BIBLIOINFO Слика 2 Визуелни ...
... екстракције информација. Резултат екстракције информација засно- ваног на онтологији су подаци издвојених из текста. Ови подаци се могу приказати помоћу језика за креирање онтологије (OWL). Поред тога излаз могу бити и везе са текстуалним документима из којих су подаци издвојени, при чему излаз може садржати ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Towards Automatic Definition Extraction for Serbian
U radu su prikazani preliminarni rezultati automatske ekstrakcije kandidata za definicije rečnika iz nestrukturiranih tekstova na srpskom jeziku u cilju ubrzanja razvoja rečnika. Definicije u rečniku Srpske akademije nauka i umetnosti (SANU) korišćene su za modelovanje različitih tipova definicija (opisnih, gramatičkih, referentnih i sinonimskih) koje imaju različite sintaksičke i leksičke karakteristike. Korpus istraživanja sastoji se od 61.213 definicija imenica, koje su analizirane korišćenjem morfoloških e-rečnika i lokalnih gramatika implementiranih kao pretvarači konačnih stanja u paketu za obradu korpusa otvorenog ...... leksikografske definicije u deskriptivnom rečniku (na materijalu rečnika srpskog jezika) [Metalanguage of lexicographic definition in descriptive dictionary (on the material of the Serbian language dictionary)]. Južnoslovenski filolog 74/1, 2018, pp. 81–96. Ristić, S. (2003). Leksikografski metajezik ...
... домородачког становништва Папуанаца (Papuan woman N a member of the indigenous population of the Papuans) 12 (3) people 21 8 (38%) Бугари N јужнословенски народ (Bulgarians N South Slavic people) 13 (2) proper names (facilities, deities, astral bodies, holidays) 94 24 (26%) Вечерњача ...
... 2007, pp. 65–70. SASA Dictionary: Речник српскохрватског књижевног и народног језика САНУ, I–XXI [The Dictionary of the Serbo-Croatian Standard and Vernacular Language] (1959–2020). Београд: Институт за српски језик САНУ и САНУ. Spala, S., Miller, N., Yang, Y., Dernoncourt, F. & Dockhorn, C. (2019) ...Ranka Stanković, Cvetana Krstev, Rada Stijović, Mirjana Gočanin, Mihailo Škorić. "Towards Automatic Definition Extraction for Serbian" in Proceedings of the XIX EURALEX Congress of the European Assocition for Lexicography: Lexicography for Inclusion (Volume 2). 7-9 September (virtual), Democritus University of Thrace (2021)
-
Језички модели, шта је то?
Михаило Шкорић (2023)Михаило Шкорић. "Језички модели, шта је то?" in Језик данас, Нови Сад : Матица српска (2023)
-
Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji
Ljiljana R. Kolonja (2016-09-23)Postojeća organizacija zaštite na radu na površinskim kopovima uglja često nije umogućnosti da blagovremeno i tačno ukaže na nedostatke, koji mogu u bližoj ilidaljoj budućnosti da budu uzrok narušavanja bezbednosti radnika, ali i uzrokoštećenja materijalnih dobara rudnika. Nemogućnost donošenja pravovremenihodluka je moguće izbeći uvođenjem softverski podržanih sistema za praćenje ianalizu bezbednosti i zaštite na radu.Osnovni cilj ove doktorske disertacije je definisanje metodologije i razvoj modelasistema upravljanja zaštitom na radu, koji će omogućiti savremen, adekvatan isveobuhvatan način praćenja i analize ...... striktno formalne. U grupu neformalnih spadaju ontologije definisane korišćenjem govornog jezika, dok u grupi formalnih ontologija su one koje su definisane korišćenjem veštačkih formalnih jezika ili matematičkih logika koje imaju formalnu semantiku, teoreme i dokaze osobina kao što su tačnost ...
... Sadržaj klasifikacija se obično opisuje prirodnim jezikom (slika 4.1.), što je vrlo efikasan način za ručnu primenu, na primer, za indeksiranje dokumenata, pretraživanje i kretanje po stablu. Međutim, etikete koncepata na prirodnom jeziku imaju određena ograničenja kod automatske obrade ...
... radu u rudarskoj industriji je urađeno korišćenjem UML jezika. U ovom poglavlju biće prikazani primeri karakterističnih dijagrama i opisa za vizualizovanje, specifikovanje, konstruisanje i dokumentovanje. UML kao jezik ima precizno definisanu sintaksu i semantiku, pri čemu ...Ljiljana R. Kolonja. "Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2016-09-23)
-
Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model
Ova studija predstavlja analizu sentimenta srpskih starih romana iz perioda 1840-1920, koristeći veliki jezički model (LLM) Mistral za tehniku učenja sa zasnovani na takozvanim "zero" i "few-shot" pokušajima. Glavni pristup uvodi inovacije osmišljavanjem istraživačkih upita (promptova) uključuju tekst sa uputstvom za klasifikaciju bez primera i na osnovu nekoliko primera, omogućavajući jezičkom modelu da klasifikuje osećanja u pozitivne, negativne ili objektivne kategorije. Ova metodologija ima za cilj da pojednostavi analizu osećanja ograničavanjem odgovora, čime se povećava preciznost ...Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević. "Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model" in In Proceedings of the Sixth International Conference on Computational Linguistics in Bulgaria (CLIB 2024), BAS (2024)
-
Električne mašine i uređaji u rudarstvu
Snežana Aleksandrović (2017)Snežana Aleksandrović. Električne mašine i uređaji u rudarstvu, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2017
-
Uporedna morfologija fosilnih kičmenjaka
Katarina Bogićević (2018)Katarina Bogićević. Uporedna morfologija fosilnih kičmenjaka, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2018
-
Energetska bezbednost sektora prirodnog gasa Srbije
U prve dve decenije 21. veka obezbeđivanje sigurnosti snabdevanja prirodnim gasom domaćeg tržišta bio je jedan od prioriteta razvoja energetike Srbije. Istovremeno, aspekt sigurnog snabdevanja bio je neizostavni deo slagalice stvaranja energetske bezbednosti. Izražena uvozna zavisnost je dominantna karakteristika sektora prirodnog gasa, tačnije, Republika Srbija je snažno zavisna od ruskog gasa, sa više od 80% uvezenih količina gasa, a do pre dve godine snabdevala se isključivo kroz jednu interkonekciju. U radu se razmatra aktuelna situacija u sektoru prirodnog ...... apstrakta za 36. Međunarodni kongres o procesnoj industriji – Procesing '23 Napomena: Molimo Vas, ispunite šablon na srpskom jeziku (pismo ćirilica ili latinica) ina engleskom jeziku. Note for foreign authors: Please, do fill only one template in English. SAŽETAK Autor/i Aleksandar Madžarević Predrag ...Aleksandar Madžarević, Predrag Jovančić, Miroslav Crnogorac. "Energetska bezbednost sektora prirodnog gasa Srbije" in 36. Međunarodni kongres o procesnoj industriji – Procesing ’23, Šabac, 1. i 2. juna 2023. , Beograd : Savez mašinskih i elektrotehničkih inženjera i tehničara Srbije (SMEITS) Društvo za procesnu tehniku (2023)
-
Frequency and Length of Syllables in Serbian
Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová (2019)Basic analyses of several properties of syllables (the rank-frequency distribution, the distribution of length, and the relation between length and frequency) in Serbian is presented. The syllabification algorithm used combines the maximum onset principle and the sonority hierarchy. Results indicate that syllables behave similarly to words as far as mathematical models are concerned, but values of parameters in models for syllables are quite different from those for words.... A., Martinšić-Ipšić, S., Matešić, M. (2015). Postupak automatskoga slogovanja temeljem načela najvećega pristupa i statistika slogova za hrvatski jezik. Govor 32, 3-34. Obradović, I., Obuljen, A., Vitas, D., Krstev, C., Radulović, V. (2010). Canonical syllable types in Serbian. In: Grzybek, P., Kelih ...
... Structures, Functions, Interrelations, Quantitative Perspectives: 145-157. Wien: Praesens. Piper P., Klajn I. (2013). Normativna gramatika srpskog jezika. Novi Sad: Matica srpska. Popescu, I.-I., Altmann, G., Grzybek, P., Jayaram, B.D., Köhler, R., Krupa, V., Mačutek, J., Pustet, R., Uhlířová, L. ...
... Evidence from the syllabification of intervocalic consonants. Language and Speech 40, 103-140. Stanojčić, Ž., Popović L. (1999). Gramatika srpskoga jezika. Beograd: Zavod za udžbenike i nastavna sredstva. Strauss, U., Fan, F., Altmann, G. (2008). Problems in Quantitative Linguistics 1. Lüdenscheid: ...Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová. "Frequency and Length of Syllables in Serbian" in Glottometrics (2019)
-
Part of Speech Tagging for Serbian language using Natural Language Toolkit
Ranka Stanković, Boro Milovanović (2020)Dok se razvijaju složeni algoritmi za NLP (obrada prirodnog jezika), osnovni zadaci kao što je označavanje ostaju veoma važni i još uvek izazovni. NLTK (Natural Language Toolkit) je moćna Python biblioteka za razvoj programa zasnovanih na NLP-u. Pokušavamo da iskoristimo ovu biblioteku za kreiranje PoS (vrsta reči) oznake za savremeni srpski jezik. Jedanaest različitih modela je kreirano korišćenjem NLTK API-ja za označavanje. Najbolji modeli se transformišu sa Brill tagerom da bi se poboljšala tačnost. Obučili smo modele na označenom ...Ranka Stanković, Boro Milovanović. "Part of Speech Tagging for Serbian language using Natural Language Toolkit" in 7th International Conference on Electrical, Electronic and Computing Engineering IcETRAN 2020, Academic Mind, Belgrade (2020)
-
FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain
U radu se daje kratak prikaz teorije semantike okvira, na kojoj je zasnovana leksička baza Frejmnet. Predstavljena je koncepcija ove mreže, kao i mogućnosti njene primene. Predstavljena je i leksička analiza koja se primenjuje u projektu izrade Frejmneta i ukazano na razlike između analize zasnovane na okviru u odnosu na analizu zasnovanu na reči. Zatim je prikazano nekoliko povezanih okvira koje prizivaju reči iz domena rizika. U radu je predstavljena i platforma NLTК pomoću koje se mogu koristiti ...... Language Review 27:87–112. Драгићевић, Раjна. 2007. Лексикологиjа српског jезика. Београд: Завод за уџбенике. Марковић, Александра. 2017. “Однос граматике и речника – граматика инхерентна описним речницима српског jезика.” Наш jезик XLVIII (1-2): 27–43. Поповић, Љубомир. 2003. “Интегрални речнички модели ...Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović. "FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.1
-
Одлагање индустријског отпада
Динко Кнежевић, Славко Торбица, Златко Рајковић, Мирко Недић. Одлагање индустријског отпада, Београд : Универзитет у Београду, Рударско-геолошки факултет, 2014
-
OER obrazovni sadržaji kao spona između akademskog i preduzetničkog znanja
... pojedinih oblasti javno dostupnim. Ideja je da zemlje Zapadnog Balkana kreiraju sadržaje na maternjim jezicima,prevazilazeći na taj način kritike da su OER sadržaji dostupni samo za „velike jezike“. Poseban naglasak stavljen je na uspostavljanje akademske i preduzetničke saradnje sa ciljem da se kreiraju ...
... oblasti informacionih tehnologija, geoinformatike, rudarstva i zaštite životne sredine. Takođe predviđeno je kreiranje obrazovanih sadržaja na više jezika, u više različitih formi, poput teksta, videa, animacija, audio- vizuelnih sadržaja i sl. Podsticanjem razmene znanja između akademskih ustanova i ...Ivan Obradović, Ranka Stanković, Marija Radojičić. "OER obrazovni sadržaji kao spona između akademskog i preduzetničkog znanja" in The fifth Symposium Mathematics and Applications 2014,17-18 October 2014, Belgrade V no. 1, Beograd : Matematički fakultet Univerziteta u Beogradu (2014)
-
LRMI markup of OER content within the BAEKTEL project
... module name: Leksicko prepoznavanje u obradi prirodnih jezika author: Cvetana Krstev, Biljana Lazić publisher: University of Belgrade description: Kursom su obuhvaćene morfološka, leksička i sintaksička analiza u obradi prirodnih jezika. Neke od tema su upotreba regularnih izraza za prepoznavanje ...
... Unitex about: Computational linguistics about: Natural language procesing about: Računarska linvistika about: Obrada tekstova na prirodnom jeziku about: elektronski rečnici about: analiza teksta about: konačni automati Apart from edX resources, other OER published within BAEKTEL platform ...Ranka Stanković, Daniela Carlucci, Olivera Kitanović, Nikola Vulović, Bojan Zlatić. "LRMI markup of OER content within the BAEKTEL project" in The Sixth International Conference on e-Learning (eLearning-2015), September 2015, Belgrade, Serbia, Belgrade : Belgrade Metropolitan Univesity (2015)
-
Multi-word Expressions for Abusive Speech Detection in Serbian
Ovaj rad predstavlja istraživanja na usavršavanju i unapređenju srpske verzije rečnika Hurtlex, višejezičnog leksikona uvredljivih reči. Posebnu pažnju posvećujemo dodavanju izraza sa više reči (polileksemskih jedinica) koji se mogu smatrati uvredljivim, jer su takvi leksički zapisi veoma važni za postizanje dobrih rezultata u mnoštvu zadataka otkrivanja uvredljivog jezika. Srpski morfološki rečnici se koriste kao osnova za čišćenje podataka i stvaranje rečnika. Istaknuta je veza sa drugim leksičkim i semantičkim resursima na srpskom jeziku i predviđena je izgradnja sistema za ...... both abusive and not abusive MWE were extracted is junak ‘hero’. MWEs marked as abusive are: junak gradskih salona, ‘hero of city salon’ and junak na jeziku ‘hero on the tongue (scaramouch)’, while non-abusive are junak romana ‘a hero of the novel’, junak našeg naroda ‘hero of our people’. Since the list ...
... Evaluation Conference, pages 3947–3955, Marseille, France, May. European Language Resources Association. Milica Vujanić, editor. 2007. Rečnik srpskoga jezika. Matica srpska. Michael Wiegand, Josef Ruppenhofer, Anna Schmidt, and Clayton Greenberg. 2018. Inducing a lexicon of abusive words–a feature-based ...Ranka Stanković, Jelena Mitrović, Danka Jokić, Cvetana Krstev. "Multi-word Expressions for Abusive Speech Detection in Serbian" in Proceedings of the Joint Workshop on Multiword Expressions and Electronic Lexicons, Association for Computational Linguistics (2020)
-
Softverski alati za korišćenje resursa za srpski jezik
Ivan Obradović, Ranka Stanković (2008)... alati za korišćenje resursa za srpski jezik;Software tools for Serbian lexical resources Ivan Obradović, Ranka Stanković Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Softverski alati za korišćenje resursa za srpski jezik;Software tools for Serbian lexical ...Ivan Obradović, Ranka Stanković. "Softverski alati za korišćenje resursa za srpski jezik" in INFOteka: časopis za informatiku i bibliotekarstvo, Belgrade, Serbia : Zajednica biblioteka univerziteta u Srbiji (2008)
-
OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian
Ovaj rad predstavlja novi jezički resurs za pretraživanje i istraživanje verbalnih aspektnih parova u BCS (bosanskom, hrvatskom i srpskom), kreiran korišćenjem principa Lingvističkih Povezanih Otvorenih Podataka (LLOD). Pošto ne postoji resurs koji bi pomogao učenicima bosanskog, hrvatskog i srpskog kao stranih jezika da prepoznaju aspekt glagola ili njegove parove, kreirali smo novi resurs koji će korisnicima pružiti informacije o aspektu, kao i link ka aspektnim parovima glagola. Ovaj resurs takođe sadrži spoljne linkove ka monolingvalnim rečnicima, Wordnetu i BabelNetu. ...Ranka Stanković, Maxim Ionov, Medina Bajtarević, Lorena Ninčević. "OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)
-
A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian
Uvredljivi govor na društvenim medijima, uključujući psovke, pogrdni govor i govor mržnje, dostigao je nivo pandemije. Sistem koji bi bio u stanju da detektuje takve tekstove mogao bi da pomogne da internet i društveni mediji postanu bolji virtuelni prostor sa više poštovanja. Istraživanja i komercijalna primena u ovoj oblasti do sada su bili fokusirani uglavnom na engleski jezik. Ovaj rad predstavlja rad na izgradnji AbCoSER-a, prvog korpusa uvredljivog govora na srpskom jeziku. Korpus se sastoji od 6.436 ručno označenih ...Danka Jokić, Ranka Stanković, Cvetana Krstev, Branislava Šandrih. "A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian" in 3rd Conference on Language, Data and Knowledge (LDK 2021), MDPI AG (2021). https://doi.org/10.4230/OASIcs.LDK.2021.13