Претрага
823 items
-
New Language Models for South Slavic Languages
Mihailo Škorić (2024)Izlaganje će predstaviti izazove i perspektive modelovanja južnoslovenskih jezika, sa posebnim osvrtom opšte jezičke modele građene na arhitekturi transformera (BERT, GPT), na dostupne skupove tekstova za obučavanje tih modela, te kvantitet i kvalitet tih skupova. Izlaganje će ponuditi pregled dostupnih skupova i modela, dok će posebna pažnja biti posvećena najnovijim korpusima tekstova. Prvi korpus, Kišobran, predstavlja krovni veb korpus južnoslovenskih jezika i ujedno trenutno najveći korpus tekstova na našim prostorima koji broji preko osamnaest milijardi reči i uključuje sve ...Mihailo Škorić. "New Language Models for South Slavic Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges
Pojava velikih jezičkih modela (eng. Large Language Models ili LLMs) je značajno uticala na oblast veštačke inteligencije, naročito u oblastima obrade prirodnog jezika i generisanju teksta. Međutim, ključno ograničenje ovih modela leži u nedostatku strukturiranog znanja i sposobnosti zaključivanja, što otežava njihovu primenu u stvarnom svetu, gde se zahteva tačnost iznetih činjenica i zaključivanje na osnovu konteksta. S druge strane, grafovi znanja nude primamljivo rešenje. Oni pružaju bogat izvor strukturiranog znanja, tako što predstavljaju entitete i njihove relacije u ...grafovi znanja, veliki jezički modeli, obrada prirodnog jezika, strukturirano znanje, kvalitet podataka, objašnjiva veštačka inteligencija, bezbednost sadržaja na internetuDanka Jokić, Ranka Stanković, Jelena Jaćimović. "Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024)
-
Језички модели, шта је то?
Михаило Шкорић (2023)Михаило Шкорић. "Језички модели, шта је то?" in Језик данас, Нови Сад : Матица српска (2023)
-
Развој модела за управљање рударском пројектном документацијом
Aleksandra Đ. TOMAŠEVIĆ (2018)rudarstvo, projektna dokumentacija, digitalna biblioteka, prirodno jezičke tehnologije, ekstrakcija podatakaAleksandra Đ. TOMAŠEVIĆ. Развој модела за управљање рударском пројектном документацијом, Beograd:Rudarsko Geološki Fakultet, 2018
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... ограничен скуп кључних речи или да се ручно изграде језички модели који покривају широки опсег корисникових исказа на природном језику. Коришћењем техника машинског учења, је- зички модели могу да се изграђују аутоматски из го- ворних корпуса, тј. великих колекција говорних ау- дио датотека и њихових текстуалних ...
... Translation (Изградња језичких ресурса и пре- водилачких модела за машинско превођење), ио је усмерен на јужнословенске и алканске језике (ICT 10503 RP, 2007–2008). Његов главни допринос ио је развој једносмерних преводилачких модела који се ослањају на вишејезичне ресурсе великих димен- зија, у ствари ...
... написана великим словом у српском језику или не: ‚ Дивио се Ружи. ‚ Дивио се ружи. Да и се ово постигло, могу се користити граматике специфичне за дати језик, што захтева много рада врхунских стручњака да и се оне уградиле у соф- твер, или се могу користити такозвани статистички језички модели. Такви ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Creation of a Training Dataset for Question-Answering Models in Serbian
Razvoj i primena veštačke inteligencije u jezičkim tehnologijama značajno su napredovali poslednjih godina, posebno u domenu zadatka odgovaranja na pitanja (Question Answering - QA). Dok su postojeći resursi za QA zadatke razvijeni za glavne svetske jezike, srpski jezik je relativno zanemaren u ovoj oblasti. Ovaj rad predstavlja inicijativu za kreiranje obimnog i raznovrsnog skupa podataka za obučavanje modela za odgovaranje na pitanja na srpskom jeziku, koji će doprineti unapređenju jezičkih tehnologija za srpski jezik. Pored brojnih istraživanja o jezičkim modelima ...veštačka inteligencija, obrada prirodnog jezika, jezički resursi, anotirani skupovi, ekstrakcija informacija, odgovaranje na pitanjaRanka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov. "Creation of a Training Dataset for Question-Answering Models in Serbian" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Razvoj modela upravljanja cirkulacijom u postupku bušenja korišćenjem neuro fazi sistema zaključivanja
Seyed Ali S. Razeghi (2022)Gubitak isplake predstavlja nekontrolisano isticanje bušaćeg fluida kroz formacije kao što su kaverne, pukotine, ili drugi slojevi. Tradicionalne metode procene gubitka isplake se zasnivaju na primeni seizmičkih podataka ili pronalasku „mesta“ gubitka isplake na osnovu raspoloživih podataka iz susednih bušotina. Međutim, ove metode procene nisu pouzdane.‘ U disertaciji je izvršena analiza i procena uticaja parametara bušenja, geoloških faktora, karakteristika formacije i fluida na gubitak isplake kao i na formiranje fraktura u formacijama. Uspostavljeni su modeli koji podrazumevaju proces obrade ...Seyed Ali S. Razeghi. Razvoj modela upravljanja cirkulacijom u postupku bušenja korišćenjem neuro fazi sistema zaključivanja, Beograd : [S. Razeghi], 2022
-
Речници у дигиталном добу - информатичка подршка за српски језик
Биљана Рујевић (2022)Морфолошки речници српског језика представљају електронски језички ресурс који има значајну историју развоја и коришћења за потребе обраде природних језика. С обзиром на то да су чувани у облику датотека чији је број нарастао па је самим тим управљање речницима постало отежано јавила се потреба за смештањем информација из речника у облик лексикографске базе. Како би се омогућио симултани рад на развоју речника за више корисника јавила се потреба за веб-апликацијом заснованој на лексикографској бази. Како би се размотриле ...Биљана Рујевић. Речници у дигиталном добу - информатичка подршка за српски језик, Београд : [Б. Рујевић], 2022
-
EUROLAN 2021: Introduction to Linked Data for Linguistics Online Training School
Prva škola za obuku polaznika koju je organizovala COST akcija NexusLinguarum održana je od 8. do 12. februara 2021. godine sa ciljem da studenti, istraživači i stručnjaci nauče osnove lingvističke nauke o podacima. Tokom obuke polaznici su se upoznali sa širokim spektrom tema: od semantičkog veba, RDF -a i ontologija, do modeliranja i pretraživanja jezičkih podataka pomoću najsavremenijih ontoloških modela i alata. Škola je održana u okviru serije letnjih škola EUROLAN-a i organizovalo ju je virtuelno (onlajn) nekoliko instituta; ...nauka o lingvističkim podacima, povezani podaci u lingvistici, jezički podaci, EUROLAN, NexusLinguarum, COST akcija, škola za obuku... lexicog11 – lexicography module (Bosque-Gil, Gracia, and Montiel- 6. Data Catalog Vocabulary (DCAT) - Version 2 7. Lemon - Lexicon Model for Ontologies; Lexicon Model for Ontologies: Com- munity Report, 10 May 2016 8. SKOS Simple Knowledge Organization System - home page 9. Protégé 10. VocBench: A ...
... editor. The third day was dedicated to the topics related to representing and querying lexical data with ded- icated sessions on the OntoLex-Lemon model and the SPARQL querying language. The fourth day included sessions which gave an overview of other linguistic and metadata vocabularies and the VocBench ...
... (LDK), 1-3 September in Zaragoza, Spain. McCrae, John P, Julia Bosque-Gil, Jorge Gracia, Paul Buitelaar, and Philipp Cimiano. 2017. “The Ontolex-Lemon model: development and applica- tions.” In Proceedings of eLex 2017 conference, 19–21. Stanković, Ranka, Cvetana Krstev, Biljana Lazić, and Mihailo Škorić ...Milan Dojchinovski, Julia Bosque Gil, Jorge Gracia, Ranka Stanković. "EUROLAN 2021: Introduction to Linked Data for Linguistics Online Training School" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.7
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... LEKSIČKI RESURSI Leksički resursi za srpski jezik se razvijaju u okviru Grupe za jezičke tehnologije na Matematičkom fakultetu Univerziteta u Beogradu već duži niz godina, tako da je danas na raspolaganju veliki broj različitih resursa, razvijenih u značajnom obimu (Vitas et al., 2003). Pored ...
... Filološki fakultet Sadržaj - U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem ...
... web aplikacija WS4QE koja, zajedno sa pratećim veb servisima, omogućava da se niz zadataka sada reši i preko veba. Pored kratkog opisa nekih od jezičkih resursa za srpski jezik, biće opisano kako se funkcije alata WS4LR mogu koristiti za njihovo održavanje i razvoj, kao i neke od mogućnosti za proširenje ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis
U ovom radu predstavljen je model koji omogućava prikupljanje, pripremu, opis metapodataka, upravljanje i eksploataciju, uključujući pretragu punog teksta dokumenata iz domena kriminalistike napisanih na srpskom jeziku. Predloženi pristup primenjuje se na veb portalu koji sakuplja različite tekstove nastale iz časopisa Akademije za kriminalistiku i policijske studije, Krivičnog zakona Srbije, konferencija „Tara“ i „Reiss“, kao i iz nekih doktorskih disertacija vezanih za ovu oblast istraživanje. Nakon obrade teksta, korpus koji sadrži preko 5500 stranica običnog teksta, kreiran je i ...... (ELRA), 2008 cmp Jezički resirsi Jezički resursi + Gramatike + Leksički resursi + Tekstualni resursi Tekstualni resursi + Digitalna biblioteka + Unitex Corpus + CQPweb/CQP (from Jezički resursi) Gramatike + Konačni automati + Konačni trasduktori + Flektivna pravila (from Jezički resursi) Leksički ...
... Leksički resursi + Morfološki rečnici + Rečnik bibliotekarstva + WordNet + Termi + GeolISSTerm + RudOnto (from Jezički resursi) cmp KPA jezička podrška Tekstualni resursi + Digitalna biblioteka + Unitex Corpus + CQPweb/CQP Leximir_Core + LeXRes.dll + LeXCmnRes.dll Web app KPA Omeka «REST/API» ...
... «extend» «extend» «extend» Figure 3. Linguistic resources applications DYNAMIC MODEL QUERY EXPANSIONS The dynamic aspect of the application is presented in the interaction diagram with a model of query expansion, showing messages sent between objects or class instances, as a series ...Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović. "Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis" in International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017, Academy Of Criminalistic And Police Studies Belgrade (2017)
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... делова пројектних извештаја у једну целину која би била лако доступна и претражива. Кључне речи: дигиталне библиотеке, сива литература, Омека, језички ресурси, речници 1. Дигиталне библиотеке Према једној од најцитиранијих дефиниција дигиталних библи- отека, према Вилијаму Армсу (William Arms), ...
... изазов представља повезивање различитих више- томних делова пројектних извештаја у једну целину која би била лако доступна и претражива. Још један од већих изазова јесте и природа документације пројеката који је симбиоза садржаја тектуалног, нуме- ричког, графичког и картографског типа. Пројектна док ...
... edu/lvgeology/ 10 http://bibliotheque.clermont-universite.fr/glangeaud/ 151 БИБЛИОИНФО ових потреба, током рада на докторској дисертацији Развој модела за управљање рударском пројектном документацијом (Томашевић 2018), настала је дигитална библиотека ROmeka@RGF. Назив је настао од: РО (Рударски ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... њен превод, док се електронски речници користе у истраживањима језика и креирању језичких алата. Морфолошке речнике српског језика развили су проф. др Цветана Крстев и проф. др Душко Витас уз помоћ Групe за језичке технологије Универзитета у Београду. Анализа обрађеног корпуса обухватила је екстракцију ...
... вишечланих термина из текста, одабран је приступ заснован на правилима која се ослањају на систем језичких ресурса, као што су морфолошки и електронски речници, и граматике развијене у оквиру Групе за језичке технологије Универзитета у Београду. Аутоматска процедура за екстракцију вишечланих речи (синтагми ...
... свега Катарине Поповић-Миџине, који се налази у изворима за Речник, као и морфолошки и електронски речници и граматике развијене у оквиру Групе за језичке технологије Универзитета у Београду. Они су нам омогућили да дођемо не само до примера који су уједно и одреднице, већ и до лексема које су садржане ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... текстова, • на консултовању екстерних језичких ресурса током претраге и • на комбиновању поменутих приступа. У овом раду ће бити речи о комбинованом приступу претрази корпуса заснованој и на лингвистичкој анотацији корпусних текстова и на консулто- вању екстерних језичких ресурса. У питању је природан наставак ...
... корпуса, Вебран се користи и за претрагу једнојезичних и вишејезичних дигиталних библиотека развијених у оквиру Групе за језичке технологије Универзитета у Београду и Друштва за језичке ресурсе и технологије Јертех. Развој Вебрана је заснован на Мајкрософт технологији RESTful API9 (ASP.NET Web API) за ...
... СрпКор2013”, Група за језичке технологије Универзитета у Београду, http://www.korpus.matf.bg.ac.rs/korpus (датум приступа: 30.6.2019). РудКор 2018: „Рударски корпус, специјализовани корпус из области ру- дарства”, Универзитет у Београду, Рударско-геолошки факултет, Група за језичке технологије Универзитета ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... ovih problema razvijen u Grupi za jezičke tehnologije Univerziteta u Beogradu. Radi se, zapravo, o metodologiji i tehničkim rešenjima koja se u okviru Grupe koriste za kreiranje paralelizovanih korpusa. 2. Kreiranje paralelizovanog korpusa U Grupi za jezičke tehnologije postupak pripreme tekstova ...
... se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome ...
... tome koriste. Nedostatak udobnog okruženja sa grafičkim korisničkim interfejsom, koje bi u sebi objedinilo sve ove programe, motivisalo je Grupu za jezičke tehnologije da pristupi razvoju jednog integrisanog okruženja za pripremu paralelizovanog korpusa, pod imenom ACIDE. U radu su detaljno opisane osnovne ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit
U digitalnom okruženju južnoslovenskih jezika, analiza emocija u tekstovima na društvenim mrežama postaje sve važnija za razumevanje javnog mnjenja, kreiranje personalizovanog sadržaja i analizu međusobnih interakcija korisnika. U okviru ovog rada predstavljamo detaljnu metodologiju i rezultate označavanja korpusa na srpskom jeziku prema Plutčikovom modelu kategorizacije, koji prepoznaje osam osnovnih emocionalnih kategorija, kao što su radost, tuga, bes, strah, poverenje, gađenje, iščekivanje i iznenađenje. Cilj istraživanja je da se analizira emocionalni sadržaj tekstova preuzetih sa društvenih mreža X (nekada Twitter) ...Milena Šošić, Ranka Stanković, Jelena Graovac. "Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024)
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... семантичким мрежама (Занг и др. 2008). Наравно, изградњу оваквих апликација морају да подржавају савремене информатичке технологије, пре свега, језички ресурси и онтологије. Онтологија у информатичком смислу представља именовање и дефинисање типова ентитета који постоје у одређеном домену, њихових ...
... корисников упит нуди рецепте из своје базе, а ако такви не постоје систем модификује неке постојеће (Кордије и др. 2014). Као што је случај и са другим језичким технологијама, ресурсима и алатима, и у кулинарском домену су оне за српски језик недовољно развијене (Витас и др. 2012). Овај домен до сада није ...
... ibm.com/software/IBMResearch/multimedia/Cognitive-Cooking-Fact-Sheet.pdf. 2. Развој језичких ресурса за кулинарски домен a. Корпус куварских рецепата За потребе изучавања лексике кулинарског домена, као и за потребе развоја и евалуације ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... ako ove jedinice dele veliki broj semantičkih komponenti prizivaju isti okvir ili da prizivaju okvire koji su povezani sa tezaurusom ili ontologijom. Relacije se ručno kodiraju koristeći leksičke funkcije (Mel’cuk 1995; Polguère 2014), uzimajući u obzir do tri različita jezička svojstva: sintaksičku ...
... sadrži veliki broj termina sastavljenih od više reči (višečlanih termina ili polileksemskih jedinica). U skupu podataka dobijenom iz rečnika što se tiče srpskih zapisa, 22% su jednočlani termini, 47% ima dve komponente, 17% ima tri, a preostalih 14% ima četiri ili više komponenata. Ove jezičke konstrukcije ...
... dopunu ostalih jezičkih resursa koji se godinama u nazad razvijaju na Rudarsko-geološkom fakultetu. Ontologija je percipirana kao baza opšteg znanja, ali se može preuzeti i koristiti za potrebe konkretnih rudnika. Implicitni uticaj publikovanja baze znanja i njene dostupnosti većem broju ljudi ogleda ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
From DELA Based Dictionary to Leximirka Lexical Database
Biljana Lazić, Mihailo Škorić (2020)In this paper, we will present an approach in transforming Serbian language Morphological dictionaries from a DELA text format to a lexical database dubbed Leximirka. Considering the benefits of storing data within a database when compared to storing them in textual documents, we will outline some of the functionality that the database has made possible. We will also show how hand-made rules that use category labels lexical entries are marked with can be used to link lexical entries. ...... adequate markers. 3.2 Leximirka’s lexicographic database model The lexicographic database model of Leximirka, shown in Figure 1, is guided by the Lemon, LMF and Data Category Registry catalog (Stanković et al., 2018). The implemented model provides the ability to store lexico- graphic information ...
... lexicographic database and to an online application. In Sections 3.2 and 3.3 we will give a description of Leximirka’s lexicographic database model and data categories model. An overview of the application segments will be provided in Section 4.1. The possibilities for establishing relations among lexical entries ...
... ontologies (e.g. by defining morphological categories and synsets) (McCrae et al., 2012). The Lemon model is concise, descriptive, modular and RDF based. At the time of making Leximirka database, Lemon model consisted of five modules: Ontology-lexicon interface – ontolex, Syntax and Semantics – synsem, De- ...Biljana Lazić, Mihailo Škorić. "From DELA Based Dictionary to Leximirka Lexical Database" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.4
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... временском периоду од готово два столећа, „покрива” домене књижевног и народног српског језичког ареала. Унапред успостављен теоријско-мето- долошки приступ у изради овог дела, креиран од стране наших највећих лексикографа3 (иначе утемељивача и еминентних представника београдске лексикографске школе) ...
... о просечној дужини речи, о употреби интерпункције, о коришћењу малих и великих слова, броју, типу и учесталости емотограма и сл. У раду се поставља питање: да ли је могуће техникама машинског учења обучити математички модел (са опцијом за аутоматску идентификацију) да ау- томатски идентификује аутора ...
... се може употребљавати приликом обучавања матема- тичких модела. Размотримо конкретан пример: „Ко рано рани, две среће граби!” Узевши у обзир следећа обележја: (1) укупан број карактера, (2) укупан број малих слова, (3) укупан број великих слова, (4) укупан број узвичника и (5) укупан број цифара ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13