Претрага ⚒ Радови ⚒ Др РГФ - Репозиторијум РГФ

Per page

Sort by

169 items

The Many Faces of SrpKor

Duško Vitas, Ranka Stanković, Cvetana Krstev (2024.)

Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...

СрпКор, корпуси, српски, лематизација, Лексимирка

Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.) М64
Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit

Milena Šošić, Ranka Stanković, Jelena Graovac (2024)

U digitalnom okruženju južnoslovenskih jezika, analiza emocija u tekstovima na društvenim mrežama postaje sve važnija za razumevanje javnog mnjenja, kreiranje personalizovanog sadržaja i analizu međusobnih interakcija korisnika. U okviru ovog rada predstavljamo detaljnu metodologiju i rezultate označavanja korpusa na srpskom jeziku prema Plutčikovom modelu kategorizacije, koji prepoznaje osam osnovnih emocionalnih kategorija, kao što su radost, tuga, bes, strah, poverenje, gađenje, iščekivanje i iznenađenje. Cilj istraživanja je da se analizira emocionalni sadržaj tekstova preuzetih sa društvenih mreža X (nekada Twitter) ...

emocije, Plutčikov model, označavanje, korpus, društvene mreže, srpski jezik

Milena Šošić, Ranka Stanković, Jelena Graovac. "Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024) М64
Creation of a Training Dataset for Question-Answering Models in Serbian

Ranka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov (2024)

Razvoj i primena veštačke inteligencije u jezičkim tehnologijama značajno su napredovali poslednjih godina, posebno u domenu zadatka odgovaranja na pitanja (Question Answering - QA). Dok su postojeći resursi za QA zadatke razvijeni za glavne svetske jezike, srpski jezik je relativno zanemaren u ovoj oblasti. Ovaj rad predstavlja inicijativu za kreiranje obimnog i raznovrsnog skupa podataka za obučavanje modela za odgovaranje na pitanja na srpskom jeziku, koji će doprineti unapređenju jezičkih tehnologija za srpski jezik. Pored brojnih istraživanja o jezičkim modelima ...

veštačka inteligencija, obrada prirodnog jezika, jezički resursi, anotirani skupovi, ekstrakcija informacija, odgovaranje na pitanja

Ranka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov. "Creation of a Training Dataset for Question-Answering Models in Serbian" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024) М64
Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges

Danka Jokić, Ranka Stanković, Jelena Jaćimović (2024)

Pojava velikih jezičkih modela (eng. Large Language Models ili LLMs) je značajno uticala na oblast veštačke inteligencije, naročito u oblastima obrade prirodnog jezika i generisanju teksta. Međutim, ključno ograničenje ovih modela leži u nedostatku strukturiranog znanja i sposobnosti zaključivanja, što otežava njihovu primenu u stvarnom svetu, gde se zahteva tačnost iznetih činjenica i zaključivanje na osnovu konteksta. S druge strane, grafovi znanja nude primamljivo rešenje. Oni pružaju bogat izvor strukturiranog znanja, tako što predstavljaju entitete i njihove relacije u ...

grafovi znanja, veliki jezički modeli, obrada prirodnog jezika, strukturirano znanje, kvalitet podataka, objašnjiva veštačka inteligencija, bezbednost sadržaja na internetu

Danka Jokić, Ranka Stanković, Jelena Jaćimović. "Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024) М64
Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic

Teodora Mihajlov, Milica Ikonić Nešić, Ranka Stanković, Olivera Kitanović (2024)

Modeliranje tema je efikasan način da se dobije uvid u velike količine podataka. Neki od najčešće korišćenih metoda za modeliranje tema su Latentna Dirihleova alokacija (LDA) i faktorizacija nenegativne matrice (NMF). Međutim, sa porastom modela samopažnje i unapred obučenih jezičkih modela, pojavili su se novi načini za ekstrakcju tema. BERTopic predstavlja novi pristup modeliranju tema. U ovom radu smo uporedili performanse LDA, NMF i BERTopic na književnim tekstovima na srpskom, merenjem koherentnosti tema i raznovrsnosti tema, kao i kvalitativnom ...

jezički modeli, LDA, modeliranje tema, BERT, BERTopic

Teodora Mihajlov, Milica Ikonić Nešić, Ranka Stanković, Olivera Kitanović. "Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic" in Annals of Computer Science and Information Systems, IEEE (2024). https://doi.org/10.15439/2024F1593 М33
SrpCNNeL: Serbian Model for Named Entity Linking

Milica Ikonić Nešić, Saša Petalinkar, Ranka Stanković, Miloš Utvić, Olivera Kitanović (2024)

Ovaj rad predstavlja razvoj modela za prepoznavanje i povezivanje imenovanih entiteta (NEL) sa bazom znanja Vikipodaci za srpski jezik pod nazivom SrpCNNeL. Model je obučen da prepozna i poveže sedam različitih imenovanih tipova entiteta (osobe, lokacije, organizacije, profesije, događaji, demoni i umetnička dela) na skupu podataka koji sadrži rečenice iz romana, pravnih dokumenata, kao i rečenice generisane iz znanja Vikipodataka baza i Leksimirka leksička baza podataka. Dobijeni model je pokazao dobre performanse, postigavši F1 rezultat od 0,8 na test ...

obeležavanje imenovanih entiteta, povezivanje imenovanih entiteta, Vikipodaci, NER, NEL

Milica Ikonić Nešić, Saša Petalinkar, Ranka Stanković, Miloš Utvić, Olivera Kitanović. "SrpCNNeL: Serbian Model for Named Entity Linking" in Annals of Computer Science and Information Systems, IEEE (2024). https://doi.org/10.15439/2024F8827 М33
CliRtheRoads: An Integrated Approach to Landslide Risk Management on Roads in Serbia

Biljana Abolmasov, Ranka Stanković, Miloš Marjanović, Nikola Vulović, Uroš Đurić (2023)

baza podataka o klizištima, mobilna aplikacija, upravljanje putevima, klimatske promene

Biljana Abolmasov, Ranka Stanković, Miloš Marjanović, Nikola Vulović, Uroš Đurić . "CliRtheRoads: An Integrated Approach to Landslide Risk Management on Roads in Serbia" in Progress in Landslide Research and Technology, Springer Cham (2023). https://doi.org/https://doi.org/10.1007/978-3-031-44296-4_23 М14
BERT Downstream Task Analysis: Named Entity Recognition in Serbian

Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković (2024)

This paper compares different architectures and techniques for preparing named entity recognition (NER) models for the Serbian language via integrating BERT with spaCy. Models were trained to recognize seven different named entity types (persons, locations, organisations, professions, events, demonyms, and artworks), and are trained on the dataset containing Serbian novels published between 1840 and 1920, publicly available newspaper articles and sentences generated from the Wikidata knowledge base and Leximirka lexical database. We explore various configurations and several training pipelines ...

Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković. "BERT Downstream Task Analysis: Named Entity Recognition in Serbian" in Lecture Notes in Networks and Systems, Springer Nature Switzerland (2024). https://doi.org/10.1007/978-3-031-71419-1_29 М33
Semantic Textual Similarity of Courses Based on Text Embeddings

Olivera Kitanović, Aleksandra Tomašević, Mihailo Škorić, Ranka Stanković, Ljiljana Kolonja (2024)

This paper explores the application of textual embeddings to measure semantic similarity between educational courses’ curriculums, aiming to enhance the effectiveness of the next faculty accreditation. Leveraging state-of-the-art natural language processing techniques, we employ pre-trained embeddings to capture the semantic meaning of course descriptions. Our methodology involves transforming course curriculum texts into high-dimensional vector representations, enabling efficient and meaningful comparisons. We evaluate the proposed approach on a diverse dataset of course descriptions, employing established benchmarks for semantic textual similarity ...

Olivera Kitanović, Aleksandra Tomašević, Mihailo Škorić, Ranka Stanković, Ljiljana Kolonja. "Semantic Textual Similarity of Courses Based on Text Embeddings" in Lecture Notes in Networks and Systems, Springer Nature Switzerland (2024). https://doi.org/10.1007/978-3-031-71419-1_27 М33

Претрага

169 items

The Many Faces of SrpKor cite

Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit cite

Creation of a Training Dataset for Question-Answering Models in Serbian cite

Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges cite

Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic cite

SrpCNNeL: Serbian Model for Named Entity Linking cite

CliRtheRoads: An Integrated Approach to Landslide Risk Management on Roads in Serbia cite

BERT Downstream Task Analysis: Named Entity Recognition in Serbian cite

Semantic Textual Similarity of Courses Based on Text Embeddings cite

The Many Faces of SrpKor

Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit

Creation of a Training Dataset for Question-Answering Models in Serbian

Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges

Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic

SrpCNNeL: Serbian Model for Named Entity Linking

CliRtheRoads: An Integrated Approach to Landslide Risk Management on Roads in Serbia

BERT Downstream Task Analysis: Named Entity Recognition in Serbian

Semantic Textual Similarity of Courses Based on Text Embeddings