Претрага
280 items
-
Integrisanje heterogenih leksičkih resursa
Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite vrste leksičkih informacija. Integracijom ovih resursa, informacije ...... Abstrakt Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička ...
... kao i u primene vezane za obradu prirodnojezičkih dokumenata. 1. Uvod Među reursima razvijenim u okviru Grupe za obradu prirodnih jezika na Matematičkom fakultetu Univerziteta u Beogradu od posebnog značaja su: • Sistem morfoloških rečnika SrpDic srpskog jezika, koji se sastoji od rečnika ...
... Za početak, veličina srpskog MR i srpskog WN nije uporediva. Razvoj srpskog MR je započet više godina pre WN, tako da on potpunije pokriva jezik. Zbog toga, srpski MR može manje da dobije od WN nego obrnuto. Iz tog razloga je stvaranje potpuno semantički anotiranog srpskog DELAS rečnika odloženo ...Ranka Stanković, Cvetana Krstev, Duško Vitas, Ivan Obradović, Gordana Pavlović-Lažetić. "Integrisanje heterogenih leksičkih resursa" in Festivalski katalog 11. Festivala informatičkih dostignuća INFOFEST 2004, 26th September - 2nd October, 2004, Budva, Montenegro, INFOFEST (2004)
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... аутоматски исправљан коришћењем електронских морфолошких речника српског језика. b. Електронски морфолошки речник српског језика и кулинарски домен Електронски морфолошки речници српског језика намењени искључиво аутоматској обради развијају се већ дуги низ година (Крстев 2008), те њихова данашња ...
... ulinary Пре темељног приступа обради кулинарског домена електронски речници српског језика су већ садржали значајан део кулинарске лексике, али она већином није била систематски означена потребним маркерима. Анализом доменског корпуса и консултовањем српског ворднета прво су одабрани адекватни ...
... која означава храну којој може да претходи прилог и један или више придева. За обраду доменског корпуса, примену морфолошких електронских речника српског језика и израду локалних граматика користили смо систем за обраду корпуса Unitex.16 Локалне граматике смо имплементирали у облику коначних аутомата ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)
-
Нове технологије за оживљавање старих текстова
удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитетиЦветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... заиста zaista PAR zaista ретко retko ADV retko виђали vidxali V vidxati . . SENT . 1.1 корпус савременог српског језика (српкор) СрпКор2013 је актуелна верзија Корпуса савременог српског језика (Корпус 2013)4. СрпКор2013 је корпус опште намене величине преко 122 ми- лиона корпусних речи, односно ...
... њихову имплементацију. Вебран гене- рише проширење упита на основу различитих лексичких ресурса српског језика, од којих су најзначајнији: • СМР, систем морфолошких електронских речника српског језика (Крстев 2008), • семантичка мрежа Српски ворднет10 (Крстев и др. 2004), • терминолошке базе ...
... савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... semantička, derivaciona i druga svojstva leme. Format na kome se bazira razvoj sistema morfoloških rečnika srpskog jezika poznat je kao LADL format (Courtois/Silberztein 1990). Za obradu tekstova pomoću rečnika u LADL formatu prvobitno je korišćen sistem Intex (Silberztein 1993). No kako Intex ...
... za srpski jezik se razvijaju u okviru Grupe za jezičke tehnologije na Matematičkom fakultetu Univeziteta u Beogradu (Grupa) već duži niz godina, tako da je danas na raspolaganju veliki broj različitih resursa, razvijenih u značajnom obimu (Vitas et al. 2003). Pored korpusa srpskog jezika, kao i ...
... višejezičnih paralalenih korpusa, od posebnog su značaja sistem morfoloških rečnika srpskog jezika (SMR), kao i semantička mreža za srpski jezik (srpski wordnet – SWN) razvijena u okviru međunarodnog projekta Balkanet (Tufiş 2004). S obzirom na to da su ovi resursi nastajali tokom dužeg vremena ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... морфо- синтаксички опис српског језика, поравнату вер- зију српског превода романа „1984” Џорџа Орвела, његову лематизирану и морфосинтаксички етикети- рану верзију и исцрпан речник који покрива ком- плетну лексику романа „1984”. Ситуација у разним доменима обраде српског језика је различита, али значајан ...
... одељку описаћемо улогу српског језика у европскоминформациономдруштвуидаћемооцену текућег стања језичких технологија за српски језик. 9 3 СРПСКИ ЈЕЗИК У ЕВРОПСКОМ ИНФОРМАЦИОНОМ ДРУШТВУ 3.1 ОПШТИ ПОДАЦИ Српски стандардни језик је национални стандардни језик Сра и званични језик у Репулици Срији. ...
... потпо- могнуто учење језика (CALL). 3.6 МЕЂУНАРОДНИ АСПЕКТИ Званична употреа и настава српског језика у др- жавама у којима живе делови српског народа ре- гулисана је законодавством тих држава. Нестанак заједничког српскохрватског језика и званично по- стојање посених језика штокавске провенијенције ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Речници у дигиталном добу - информатичка подршка за српски језик
Биљана Рујевић (2022)Морфолошки речници српског језика представљају електронски језички ресурс који има значајну историју развоја и коришћења за потребе обраде природних језика. С обзиром на то да су чувани у облику датотека чији је број нарастао па је самим тим управљање речницима постало отежано јавила се потреба за смештањем информација из речника у облик лексикографске базе. Како би се омогућио симултани рад на развоју речника за више корисника јавила се потреба за веб-апликацијом заснованој на лексикографској бази. Како би се размотриле ...Биљана Рујевић. Речници у дигиталном добу - информатичка подршка за српски језик, Београд : [Б. Рујевић], 2022
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... Лингвистичка обрада је урађена применом електронских речника, након чега је креиране „врећа речи“ са фреквенцијама појављивања и рачунањем релативних фреквенција „на милион речи“. За поређење релативне фреквенције кулинарских термина са референтним корпусом коришћен је Корпус савременог српског језика (korpus ...
... српскохрватског књижевног и народног језика треба да садржи, када буде завршен1, целокупну лексику2 савременог српског језика3, како књижевног језика тако и српских народних говора4. Све одредничке речи илустроване су примерима из писаних извора и са најширег српског дијалекатског подручја, презентованим ...
... обрасцима Један од водећих истраживача у области обраде природних језика, Дан Џурафски, у књизи „Језик хране“ (Jurafsky, 2014), приказује еволуцију обичаја, назива, рецепата који прате говор о храни. Ту се може видети лексичка и концептуална сложеност језика хране. Покушали смо да извучемо карактеристичне ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Белешка о дигитализацији речника
У раду ће се анализирати ограничења која проистичу из линеарног процеса традиционалне израде речника на примеру Речника САНУ. Начин да се превазиђу ова ограничења се састоји у формирању електронске лексикографске базе која не представља само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ.... 44/3, 105–116 Витас 2016: Душко Витас, „Инфраструктура за изучавање и обраду српског језика”, у: зборник института за српски језик сану III (уредник Срето Танасић), Београд: Институт за српски језик САНУ, 115–129. Еткинс и др. 2008: Atkins, B. T. Sue; Michael Rundell. The Oxford Guide to Practical ...
... 2007: Душко Витас, „О проблему не(пре)познате речи у обради текс- това на српском језику”, зборник матице српске за филологију и линг- вистику, L, 111–120. Витас/Крстев 2015: Душко Витас и Цветана Крстев, „Нацрт за информа- тизовани речник српског језика”, научни састанак слависта у вукове дане, 44/3 ...
... говорници ин- форматички боље опремљених језика. Назначимо да ово питање није питање локализације (или прилагођавања) софтверских пакета, већ питање суштин- ске интеграције српског језика у различите апликације да се не би морале ко- ристити само посредством других језика. У извесном смислу, ова ситуација ...Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић. "Белешка о дигитализацији речника" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch3
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... razvijenih u značajnom obimu (Vitas et al., 2003). Pored korpusa srpskog jezika, kao i višejezičnih paralelnih korpusa, od posebnog su značaja sistem morfoloških rečnika srpskog jezika, kao i semantička mreža za srpski jezik (srpski wordnet) razvijena u okviru međunarodnog projekta Balkanet ...
... imena, kao jedinstvenog koncepta u različitim jezicima. Naime, u višejezičnom kontekstu, opis vlastitih 1 LADL format, naziv potiče od naziva laboratorije u kojoj je ovaj pristup obradi prirodnih jezika nastao: Laboratoire d’Automatique Documentaire ...
... formiran je nacionalni razvojni tim, koji je u slučaju srpskog jezika predstavljala Grupa za jezičke tehnologije Univerziteta u Beogradu. Po završetku ovog projekta, razvoj SWN je nastavljen i ova mreža reči danas sadrži blizu 25000 parova reč-značenje organizovanih raspoređenih u nešto manje od ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Аутоматска екстракција дефиниција – допринос убрзању израде речника
дескриптивни речници, метаанализа лексикографских дефиниција, аутоматска екстракција дефиниција, електронски речници, српски језикРада Стијовић, Цветана Крстев, Ранка Станковић. "Аутоматска екстракција дефиниција – допринос убрзању израде речника" in Лексикологија и лексикографија у светлу актуелних проблема, Институт за српски језик САНУ (2021)
-
Possibilities of retro-digitalized German-Serbian Mining Dictionary
U radu će biti prikazan opis procesa retrodigitalizacije dvojezičnog Nemačko-srpskog rudarskog rečnika iz 1923. godine čiji je autor rudarski inženjer Dragutin Stepanović (Степановић, 1923). Ovaj rečnik je zasnovan na skoro 4 000 leksičkih zapisa koji su prevodilački ekvivalenti ili uputnice. Umesto predgovora autor daje uvid u svoje pismo upućeno “Ministru šuma i rudnika” u kome piše o nameri da zabeleži reči koje se koriste u narodu kako bi izbegao upotrebu nemačkih reči. Iako broj odrednica nije toliko veliki, rečnik ...Biljana Lazić, Olivera Kitanović, Ivan Obradović. "Possibilities of retro-digitalized German-Serbian Mining Dictionary" in E-dictionaries and E-lexicography, Zagreb, 10-11 May 2019, Zagreb : Institut za hrvatski jezik i jezikoslovlje (2019)
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... korpusa | Ivan Obradović, Ranka Stanković, Miloš Utvić | Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007 | 2007 | | http://dr.rgf.bg.ac.rs/s/repo/item/0005260 Дигитални репозиторијум Рударско-геолошког факултета Универзитета ...
... sadržine, najčešće na dva različita jezika. Treba, međutim, napomenuti da paralelni tekstovi mogu postojati i na istom jeziku, recimo kada se radi o dva različita prevoda istog književnog dela. Paralelni tekstovi se mogu sastojati i od više tekstova, na više jezika, pri čemu je bitno da su svi tekstovi ...
... odgovarajućim prevodom na jednom ili više ciljnih jezika, ovakav format je pogodan i za paralelizovane tekstove koji takođe nastaju prevođenjem sa jednog jezika na drugi. U TMX formatu se koriste ISO standardi za datume, vreme, i oznake država i jezika. Trenutna verzija standarda je TMX 1.4b, mada je ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Football terminology: compilation and transformation into OntoLex-Lemon resource
У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или ...Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević. "Football terminology: compilation and transformation into OntoLex-Lemon resource" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... „препознавање образаца” (енгл. Pattern Recognition). Подучавање рачунара да разуме и производи природан језик зове се обрада природних језика (енгл. Natural Language Processing). А обрада природних језика решава различите проблеме у разумевању текста који се тичу препознавања говора (енгл. Speech Recognition) ...
... Матица српска ‒ Институт за српскохрватски језик, 109–115. Пешикан 1963: Митар Пешикан, „О Речнику Српске академије наука и уметности”, наш језик, XIII/3–5, 169–196. Пешикан 1966: Митар Пешикан, „О начелима обраде и развијања стручне терминологије”, наш језик, XV, 180–194. Пешикан 1967: Митар Пешикан ...
... за српск(охрватск)и језик САНУ (рукопис) 1959. и (допуњено) 2017. Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин316 Утвић 2014: Miloš Utvić, The construction of reference corpus of contemporary Serbian [Izgradnja referentnog korpusa savremenog srpskog jezika] (Doc- toral dissertation ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain
U radu se daje kratak prikaz teorije semantike okvira, na kojoj je zasnovana leksička baza Frejmnet. Predstavljena je koncepcija ove mreže, kao i mogućnosti njene primene. Predstavljena je i leksička analiza koja se primenjuje u projektu izrade Frejmneta i ukazano na razlike između analize zasnovane na okviru u odnosu na analizu zasnovanu na reči. Zatim je prikazano nekoliko povezanih okvira koje prizivaju reči iz domena rizika. U radu je predstavljena i platforma NLTК pomoću koje se mogu koristiti ...... Language Review 27:87–112. Драгићевић, Раjна. 2007. Лексикологиjа српског jезика. Београд: Завод за уџбенике. Марковић, Александра. 2017. “Однос граматике и речника – граматика инхерентна описним речницима српског jезика.” Наш jезик XLVIII (1-2): 27–43. Поповић, Љубомир. 2003. “Интегрални речнички ...Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović. "FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.1
-
Vebran Web Services for Corpus Query Expansion
Ranka Stanković, Miloš Utvić (2020)U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.... “Vebran Web Service . . . ”, pp. 99–118 Утвић, Милош. “Анотациjа Корпуса савременог српског jезика”. Инфотека Vol. XII, no. 2 (2011): 39–51 Utvić, Miloš. “Izgradnja referentnog korpusa savremenog srpskog jezika”. Phdthesis, Univerzitet u Beogradu, Filološki fakultet, Beograd, 2014, accessed August ...
... https://fedorabg.bg.ac.rs/fedora/get/o: 10061/bdef:Content/download Утвић, Милош. “Листе учестаности Корпуса савременог српског jезика”. In Научни састанак слависта у Вукове дане. Српски jезик и његови ресурси: теориjа, опис и примене. 3/43. научни састанак слависта у Вукове дане, Београд, 12-15. IX 2013. ...
... Обрадовић, Ранка М. Станковић, Александра Ђ. Томашевић and Биљана Ђ. Лазић. “Изградња специjалних корпуса савременог српског jезика на примеру корпуса из области рударства”. In Српски jезик и његови ресурси: теориjа, опис и примене. 3/47. научни састанак слависта у Вукове дане, Београд, 2017., Ћорић, Б ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
-
SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian
Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković (2019)У овом раду представљамо модел за избор добрих примера за речник српског језика и развој иницијалних компоненти модела. Метода која се користи заснива се на детаљној анализи различитих лексичких и синтактичких карактеристика у корпусу састављених од примера из пет дигитализованих свезака речника САНУ. Почетни скуп функција био је инспирисан сличним приступом и за друге језике. Дистрибуција карактеристика примера из овог корпуса упоређује се са карактеристиком дистрибуције узорака реченица ексцерпираних из корпуса који садрже различите текстове. Анализа је показала да ...Српски, добри примери из речника, аутоматизација израде речника, издвајање својстава, Машинско учење... [Izgradnja referentnog korpusa savremenog srpskog jezika] (Doctoral dissertation, University of Belgrade). Vitas D. & Krstev C. (2015). Blueprint for the computerized dictionary of the Serbian language [Nacrt za informatizovani rečnik srpskog jezika]. Naučni sastanak slavista u Vukove dane, 44(3) ...
... rečnika na primeru 268 Proceedings of eLex 2019 Rečnika srpskohrvatskog književnog i narodnog jezika SANU i Instituta za srpskohrvatski jezik. In IV međunarodni naučni skup „Računarska obrada jezičkih podataka”, Portorož: Institut Jožef Stefan, pp. 375–384 [Possibility for modernizing the ...
... dictionary contains only a small portion of these citations because of the described selection criteria. 2 Упутство за обраду Речника, Београд: Институт за српск(охрватск)и језик САНУ (рукопис), 1959. и (допуњено) 2017 [A Style Guide for Dictionary-Making, Belgrade: SASA Institute for Serbo(-Croatian) ...Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković. "SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian" in Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference , Lexical Computing CZ, s.r.o. (2019)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... pridev, veznik, ili neka druga vrsta reči saglasno gramatici srpskog jezika. Za anotaciju je korišćen servis za obradu teksta Društva za jezičke resurse i tehnologije Jerteh66 (Stanković et al. 2020), koji omogućava različite vrste obrade teksta. Slika 4-5 prikazuje alat za anotaciju teksta gde se na ...
... tehnike za obradu prirodnog jezika (NLP): metoda konačnih automata (Gross 1987) i upitni jezik CQL (eng. Corpus Query Language) zasnovan na podudaranju obrazaca u sistemu za upravljanje velikim količinama tekstualnih podataka CQP (eng. Corpus Query Processor) (Evert 2005). Tehnikama obrade prirodnog ...
... informacije o komponentama složene reči. Slika 3-4 Panel alate Leximirka za reč “odnos uzrok-posledica” 3.2.4. Obrada teksta na prirodnom jeziku - Unitex Obrada prirodnih jezika se implementira različitim pristupima: simboličkim pravilima, statističkim metodama, mašinskim učenjem, i hibridnim pristupom ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Electronic Dictionaries - from File System to lemon Based Lexical Database
In this paper we discuss some well-known morphological descriptions used in various projects and applications (most notably MULTEXT-East and Unitex) and illustrate the encountered problems on Serbian. We have spotted four groups of problems: the lack of a value for an existing category, the lack of a category, the interdependence of values and categories lacking some description, and the lack of a support for some types of categories. At the same time, various descriptions often describe exactly the same ...... 2017 conference. Lei- den, the Netherlands, 19 – 21 September 2017, pages 598–613, Leiden, Netherlands, September. Klajn, I. (2005). Gramatika srpskog jezika. Zavod za udžbenike. Koeva, S., Krstev, C., and Vitas, D. (2008). Morpho- semantic relations in wordnet–a case study for two slavic languages ...
... Linguis- tics in Serbia, pages 12–26. University of Belgrade, Fac- ulty of Mathematics. Stanojčić, Ž. and Popović, L. (2008). Gramatika srpskog jezika. Zavod za udžbenike. Tutin, A. and Véronis, J. (1998). Electronic dictionary en- coding: Customizing the TEI guidelines. In Proc. Eu- ralex ...
... the maintenance of dictionaries of inflected word forms is very important. For instance, inflected forms of jezik are: jezik, jezika, jeziku, jeziče, jezikom, jezici, jezike, jezicima. In the model presented, the table Forms is used to store all forms that are inflected from a lemma, together ...Ranka Stanković, Cvetana Krstev, Biljana Lazić, Mihailo Škorić. "Electronic Dictionaries - from File System to lemon Based Lexical Database" in Proceedings of the 11th International Conference on Language Resources and Evaluation - W23 6th Workshop on Linked Data in Linguistics : Towards Linguistic Data Science (LDL-2018), LREC 2018, Miyazaki, Japan, May 7-12, 2018, European Language Resources Association (ELRA) (2018)