Претрага ⚒ Радови ⚒ Др РГФ - Репозиторијум РГФ

Претрага

Per page

Sort by

48 items

Annotation of the Serbian ELTeC Collection

Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić (2021)

Ovaj rad predstavlja takozvano izdanje nivoa 2 kolekcije tekstova SrpELTeC razvijene u okviru aktivnosti Radne grupe 2 – Metode i alati COST akcije CA 16204 (Distant Reading for European Literary History) i njene specifikacije šeme. Izdanje nivoa 2 je nastavak izdanja nivoa 1, koje se koristi kao ulaz za morfosintaksičke i NER anotacije romana. Srpska obrada nivoa-2 je navedena kroz potrebne korake, uključujući metode i alate koji se koriste u tom procesu. Neki statistički podaci iz srpske kolekcije nivoa ...

udaljeno čitanje, literarni korpus, tagiranje, prepoznavanje imenovanih entiteta, lematizacija, ELTeC

Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić. "Annotation of the Serbian ELTeC Collection" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.2.3 М53
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса

Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић (2019)

У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...

корпус, рударство, претраживање информација, проширивање упита, лексички ресурси, лексичке релације

Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12 М51
Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian

Ranka Stanković, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, Mihailo Škorić (2020)

The training of new tagger models for Serbian is primarily motivated by the enhancement of the existing tagset with the grammatical category of a gender. The harmonization of resources that were manually annotated within different projects over a long period of time was an important task, enabled by the development of tools that support partial automation. The supporting tools take into account different taggers and tagsets. This paper focuses on TreeTagger and spaCy taggers, and the annotation schema alignment ...

Part-of-Speech tagging, lemmatization, corpus, evaluation, Serbian, morphological dictionary

Ranka Stanković, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, Mihailo Škorić. "Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian" in Proceedings of the 12th Language Resources and Evaluation Conference, May Year: 2020, Marseille, France, European Language Resources Association (2020) М33
Football terminology: compilation and transformation into OntoLex-Lemon resource

Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević (2023)

У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или ...

повезани отворени подаци, корпус, СрФудКо, OntoLex, OntoLex-FrAC

Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević. "Football terminology: compilation and transformation into OntoLex-Lemon resource" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj М33
From ELTeC Text Collection Metadata and Named Entities to Linked-data (and Back)

Milica Ikonić Nešić, Ranka Stanković, Christof Schöch and Mihailo Škorić (2022)

In this paper we present the wikification of the ELTeC (European Literary Text Collection), developed within the COST Action ``Distant Reading for European Literary History'' (CA16204). ELTeC is a multilingual corpus of novels written in the time period 1840—1920, built to apply distant reading methods and tools to explore the European literary history. We present the pipeline that led to the production of the linked dataset, the novels’ metadata retrieval and named entity recognition, transformation, mapping and Wikidata population, ...

Wikidata, linked data, SPARQL, distant reading, literary corpus, named entity linking, ELTeC

Milica Ikonić Nešić, Ranka Stanković, Christof Schöch and Mihailo Škorić. "From ELTeC Text Collection Metadata and Named Entities to Linked-data (and Back)" in Proceedings of The 8th Workshop on Linked Data in Linguistics within the 13th Language Resources and Evaluation Conference, June 2022, Marseille, France, European Language Resources Association (2022) М33
Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution

Mihailo Škorić, Ranka Stanković, Milica Ikonić Nešić, Joanna Byszuk, Maciej Eder (2022)

This paper explores the effectiveness of parallel stylometric document embeddings in solving the authorship attribution task by testing a novel approach on literary texts in 7 different languages, totaling in 7051 unique 10,000-token chunks from 700 PoS and lemma annotated documents. We used these documents to produce four document embedding models using Stylo R package (word-based, lemma-based, PoS-trigrams-based, and PoS-mask-based) and one document embedding model using mBERT for each of the seven languages. We created further derivations of these ...

General Mathematics, Engineering (miscellaneous), Computer Science (miscellaneous)

Mihailo Škorić, Ranka Stanković, Milica Ikonić Nešić, Joanna Byszuk, Maciej Eder. "Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution" in Mathematics, MDPI AG (2022). https://doi.org/10.3390/math10050838 М21а
Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection

Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Duško Vitas, Mihailo Škorić, Milica Ikonić Nešić (2022)

In this paper we present the Serbian part of the ELTeC multilingual corpus of novels written in the time period 1840-1920. The corpus is being built in order to test various distant reading methods and tools with the aim of re-thinking the European literary history. We present the various steps that led to the production of the Serbian sub-collection: the novel selection and retrieval, text preparation, structural annotation, POS-tagging, lemmatization and named entity recognition. The Serbian sub-collection was published ...

Corpus, Distant Reading, Digital Humanities, Linked Data, Named Entity Recognition, Text Analytics

Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Duško Vitas, Mihailo Škorić, Milica Ikonić Nešić. "Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection" in Proceedings of the Language Resources and Evaluation Conference, June 2022, Marseille, France, European Language Resources Association (2022) М33
Towards Automatic Definition Extraction for Serbian

Ranka Stanković, Cvetana Krstev, Rada Stijović, Mirjana Gočanin, Mihailo Škorić (2021)

U radu su prikazani preliminarni rezultati automatske ekstrakcije kandidata za definicije rečnika iz nestrukturiranih tekstova na srpskom jeziku u cilju ubrzanja razvoja rečnika. Definicije u rečniku Srpske akademije nauka i umetnosti (SANU) korišćene su za modelovanje različitih tipova definicija (opisnih, gramatičkih, referentnih i sinonimskih) koje imaju različite sintaksičke i leksičke karakteristike. Korpus istraživanja sastoji se od 61.213 definicija imenica, koje su analizirane korišćenjem morfoloških e-rečnika i lokalnih gramatika implementiranih kao pretvarači konačnih stanja u paketu za obradu korpusa otvorenog ...

Ranka Stanković, Cvetana Krstev, Rada Stijović, Mirjana Gočanin, Mihailo Škorić. "Towards Automatic Definition Extraction for Serbian" in Proceedings of the XIX EURALEX Congress of the European Assocition for Lexicography: Lexicography for Inclusion (Volume 2). 7-9 September (virtual), Democritus University of Thrace (2021) М33
A Data Driven Approach for Raw Material Terminology

Olivera Kitanović, Ranka Stanković, Aleksandra Tomašević, Mihailo Škorić, Ivan Babić, Ljiljana Kolonja (2021)

The research presented in this paper aims at creating a bilingual (sr-en), easily searchable, hypertext, born-digital, corpus-based terminological database of raw material terminology for dictionary production. The approach is based on linking dictionaries related to the raw material domain, both digitally born and printed, into a lexicon structure, aligning terminology from different dictionaries as much as possible. This paper presents the main features of this approach, data used for compilation of the terminological database, the procedure by which it has ...

sirovine, rudarstvo, terminologija, rečnik, terminološka aplikacija, mobilna aplikacija, digitizacija, leksički podaci, korpusi, otvoreni povezani podaci

Olivera Kitanović, Ranka Stanković, Aleksandra Tomašević, Mihailo Škorić, Ivan Babić, Ljiljana Kolonja. "A Data Driven Approach for Raw Material Terminology" in Applied Sciences, MDPI AG (2021). https://doi.org/10.3390/app11072892 М22
Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model

Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević (2024)

Ova studija predstavlja analizu sentimenta srpskih starih romana iz perioda 1840-1920, koristeći veliki jezički model (LLM) Mistral za tehniku učenja sa zasnovani na takozvanim "zero" i "few-shot" pokušajima. Glavni pristup uvodi inovacije osmišljavanjem istraživačkih upita (promptova) uključuju tekst sa uputstvom za klasifikaciju bez primera i na osnovu nekoliko primera, omogućavajući jezičkom modelu da klasifikuje osećanja u pozitivne, negativne ili objektivne kategorije. Ova metodologija ima za cilj da pojednostavi analizu osećanja ograničavanjem odgovora, čime se povećava preciznost ...

zero-shot, few-shot, sentiment, Serbian, Mistral model

Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević. "Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model" in In Proceedings of the Sixth International Conference on Computational Linguistics in Bulgaria (CLIB 2024), BAS (2024) М33
Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking

Ranka Stanković, Milica Ikonić Nešić, Olja Perisic, Mihailo Škorić, Olivera Kitanović (2024)

U radu se prikazuju rezultati istraživanja vezanih za pripremu paralelnih korpusa, fokusirajući se na transformaciju u RDF grafove koristeći NLP Interchange Format (NIF) za lingvističku anotaciju. Pružamo pregled paralelnog korpusa koji je korišćen u ovom studijskom slučaju, kao i proces označavanja delova govora, lematizacije i prepoznavanja imenovanih entiteta (NER). Zatim opisujemo povezivanje imenovanih entiteta (NEL), konverziju podataka u RDF, i uključivanje NIF anotacija. Proizvedene NIF datoteke su evaluirane kroz istraživanje triplestore-a korišćenjem SPARQL upita. Na kraju, razmatra se povezivanje Linked ...

paralelni korpusi, povezivanje imenovanih entiteta, prepoznavanje imenovanih entiteta, NER, NEL, povezani podaci, NIF, Vikipodaci

Ranka Stanković, Milica Ikonić Nešić, Olja Perisic, Mihailo Škorić, Olivera Kitanović. "Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024) М33
Повезивање лексема морфолошких речника коришћењем базе Лексимирка

Биљана Рујевић, Ранка Станковић, Михаило Шкорић (2024)

Рад приказује приступ успостављању повезивања лексема у Морфолошким речницима српског језика. Повезивање, тј. успостављање релација не би било могуће без претходне конверзије речника из облика текстуалних датотека у облик лексичке базе података назване Лексимирка. Методологија за успостављање релација почива на 69 појединачних релација заснованих на 388 правила. Правила за повезивање се дефинишу на основу обележја лексичких записа (врсте речи, маркера, граматичких категорија и подниски). Успостављене релације су крајњем кориснику видљиве путем апликације Лексимирка у форми хипервеза и могу се ...

морфолошки речници, повезивање лексема, лексичка база података, српски језик

Биљана Рујевић, Ранка Станковић, Михаило Шкорић. "Повезивање лексема морфолошких речника коришћењем базе Лексимирка" in Модерни речници у функцији просечнога корисника: стари проблеми, савремени правци и нови изазови, Лексикографски сусрети, Београд, 27-29. мај 2024. , Београд : Филолошки факултет (2024). https://doi.org/10.18485/lexicog_meet.2024.1.ch23 М33
Језички модели, шта је то?

Михаило Шкорић (2023)

Језички модели

Михаило Шкорић. "Језички модели, шта је то?" in Језик данас, Нови Сад : Матица српска (2023) М53
Metalogenija paleozojskih ležišta barita Bosne

Mihailo Jeremić (1960)

Metalogenija, barit, Bosna

Mihailo Jeremić. Metalogenija paleozojskih ležišta barita Bosne, Beograd:Rudarsko Geološki Fakultet, 1960
Ocena geotermalnih resursa teritorije SR Srbije van teritorija SAP

Mihailo Milivojević (1989)

Geotermalni resursi, SR Srbija

Mihailo Milivojević. Ocena geotermalnih resursa teritorije SR Srbije van teritorija SAP, Beograd:Rudarsko Geološki Fakultet, 1989
Stratigrafska i tektonska studija kristalastih terena Poreča donje Bele reke i zapadne Stare planine

Mihailo Kalenić (1992)

Stratigrafija, tektonika, kristalasti tereni, Stara planina

Mihailo Kalenić. Stratigrafska i tektonska studija kristalastih terena Poreča donje Bele reke i zapadne Stare planine, Beograd:Rudarsko Geološki Fakultet, 1992
Utrđivanje optimalnih parametara za spuštanje zasipnog materijala iz otkopanih prostora i njegovog korišćenja kod metode krovnog otkopavanja žičnih magnezita u rudniku Šumadija

Mihailo Lasica (1971)

Zasipni materijal, krovno otkopavanje, magnezit, Šumadija

Mihailo Lasica. Utrđivanje optimalnih parametara za spuštanje zasipnog materijala iz otkopanih prostora i njegovog korišćenja kod metode krovnog otkopavanja žičnih magnezita u rudniku Šumadija, Beograd:Rudarsko-geološki fakultet, 1971
Hidrogeološki aspekt kvaliteta podzemnih voda za snabdevanje naselja – na primerima iz Crnogorskog primorja

Mihailo Burić (1979)

Hidrogeologija, Crnogorsko primorje

Mihailo Burić. Hidrogeološki aspekt kvaliteta podzemnih voda za snabdevanje naselja – na primerima iz Crnogorskog primorja, Beograd:Rudarsko-geološki fakultet, 1979
Петролошке карактеристике тријаских карбоната у околини Толића (Мионица)

Михаило Вујашевић (2024)

У тријаским теренима у околини Толића код Мионице извршено је узорковање карбонатних стена које су предмет овог рада. На одабраним узорцима утврђене су петролошке карактеристике. Главни задатак овог завршног рада представља испитивање минералошких и петрографских карактеристика карбонатних стена, применом оптичке анализе, рендгенске дифракције и калциметрије. Макроскопском детерминацијом и применом Данхамове класификације испитивани узорци су сврстани у кречњаке калкаренитског до калклутитског склопа, односно mudstone, packestone и grainstone типа. Микроскопским прегледом кречњака и применом Фолкове класификације утврђен је њихов састав и ...

тријаски карбонати, петрографске карактеристике, класификације кречњака

Михаило Вујашевић. Петролошке карактеристике тријаских карбоната у околини Толића (Мионица), 2024
Природни потенцијал минералних вода Србије - Natural potential of mineral waters in Serbia

Оливера Крунић (2021)

минералне воде

Оливера Крунић. "Природни потенцијал минералних вода Србије - Natural potential of mineral waters in Serbia" in Рационално коришћење земљишта и вода у Србији - Sustainable Use of Land and Water in Serbia- Serbian Academy of Sciences and Arts; Scientific Conferences Volume CXCVII; Department of Chemical and Biological Sciences, Book 19, Српска академија наука и уметности (2021) М61

Претрага

48 items

Annotation of the Serbian ELTeC Collection cite

Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса cite

Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian cite

Football terminology: compilation and transformation into OntoLex-Lemon resource cite

From ELTeC Text Collection Metadata and Named Entities to Linked-data (and Back) cite

Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution cite

Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection cite

Towards Automatic Definition Extraction for Serbian cite

A Data Driven Approach for Raw Material Terminology cite

Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model cite

Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking cite

Повезивање лексема морфолошких речника коришћењем базе Лексимирка cite

Језички модели, шта је то? cite

Metalogenija paleozojskih ležišta barita Bosne cite

Ocena geotermalnih resursa teritorije SR Srbije van teritorija SAP cite

Stratigrafska i tektonska studija kristalastih terena Poreča donje Bele reke i zapadne Stare planine cite

Utrđivanje optimalnih parametara za spuštanje zasipnog materijala iz otkopanih prostora i njegovog korišćenja kod metode krovnog otkopavanja žičnih magnezita u rudniku Šumadija cite

Hidrogeološki aspekt kvaliteta podzemnih voda za snabdevanje naselja – na primerima iz Crnogorskog primorja cite

Петролошке карактеристике тријаских карбоната у околини Толића (Мионица) cite

Природни потенцијал минералних вода Србије - Natural potential of mineral waters in Serbia cite

Annotation of the Serbian ELTeC Collection

Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса

Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian

Football terminology: compilation and transformation into OntoLex-Lemon resource

From ELTeC Text Collection Metadata and Named Entities to Linked-data (and Back)

Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution

Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection

Towards Automatic Definition Extraction for Serbian

A Data Driven Approach for Raw Material Terminology

Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model

Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking

Повезивање лексема морфолошких речника коришћењем базе Лексимирка

Језички модели, шта је то?

Metalogenija paleozojskih ležišta barita Bosne

Ocena geotermalnih resursa teritorije SR Srbije van teritorija SAP

Stratigrafska i tektonska studija kristalastih terena Poreča donje Bele reke i zapadne Stare planine

Utrđivanje optimalnih parametara za spuštanje zasipnog materijala iz otkopanih prostora i njegovog korišćenja kod metode krovnog otkopavanja žičnih magnezita u rudniku Šumadija

Hidrogeološki aspekt kvaliteta podzemnih voda za snabdevanje naselja – na primerima iz Crnogorskog primorja

Петролошке карактеристике тријаских карбоната у околини Толића (Мионица)

Природни потенцијал минералних вода Србије - Natural potential of mineral waters in Serbia