Претрага
23 items
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... и омогућавају да се задати упит, у коме се појављује лексема X, по потреби прошири лексемама које се са лексемом X налазе у некој лексичкој релацији (синонимија, антонимија, хиперонимија итд.). Кључне речи: корпус, рударство, претраживање информација, проширивање упита, лексички ресурси, лексичке ...
... генерисање проширеног упита 1 Упит који користи КПА [hyperlemma=»ptica»] Одговор веб-сервиса S:kičmenjak Генерисани упит [lemma=»kičmenjak»] 2 Упит који користи КПА [antlemma=»opovrgnuti»] Одговор веб-сервиса S:dokazati; S:pokazati Генерисани упит [lemma=»dokazati|pokazati»] 3 Упит који користи КПА ...
... обраду упита (у даљем тексту: процесор упита) који интерпретира задати упит, ге- нерише резултате претраге корпуса, a веб-сучеље те резултате форматира и представља их кориснику. Према томе, веб-сучеље је заправо посредник између корисника и процесора упита, у једном смеру преноси задати упит од корисника ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... Treba naglasiti da bi možda adekvatniji termin bio “podešavanje” upita. Naime, pored proširivanja skupa niski koje će biti uključene u upit, korisniku se pruža i mogućnost njihovog izbora, odnosno brisanja niski iz proširenog upita za koje korisnik proceni da mogu značajno umanjiti preciznost i ...
... u izboru niski od kojih će se formirati konačni upit. Ovaj problem je naročito izražen kod pretraživanja resursa na vebu, tako da je u tom cilju razvijena aplikacija WS4QE (Workstation for Query Expansion - Radna stanica za proširivanje upita) koja, zajedno sa pratećim veb servisima, omogućava ...
... problem postavljanja upita nad tekstualnim podacima. Početne analize efekata proširivanja upita pokazale su da se proširenjem upita korišćenjem veb servisa WS4QE i leksičkih resursa mogu dobiti znatno bolji rezultati (Stanković, 2008). 5. ZAKLJUČAK Koncept proširivanja upita zasnovan na leksičkim ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... grafa. Grafovima se mogu definisati vrlo složeni upiti, ali ćemo mi ovde postavljanje takvih upita u WS4LR ilustrovati na jednom sasvim jednostavnom primeru. Naime, na slici 16 prikazan je rezultat pretrage postavljanjem upita uz pomoć jednog sasvim jednostavnog sintaksičkog grafa koji prepoznaje ...
... mogućnosti za proširivanje upita koje otvara kombinovanje resursa uz pomoć WS4LR. Raznovrsnost kriterijuma za postavljanje upita koje omogućava WS4LR rezultat vna niska karaktera – s t r i n g m a t c h i n g ; je zadate leme; e svi ili samo odabrani literali izdvojenih l. U dalje ...
... druge stran uspešno koristiti za obogać posebno je značajano kada s (ako se anje semantičkih oznaka lemama kuća i d 5. Proširenje upita iji upiti za pretraživanje tekstualnih sadržaja sastoje se od jedne ili više e, semantičke informacije iz SWN mogu se ivanje srpskog MR. Naime, neke ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... само по jедном писму jе могуће у случаjу претраживања без проширења упита, док проширење упита аутоматски подразумева оба писма. Претраживање докумената на српском jезику jе сложен процес због веома богатог морфолошког система. Упитима се наjчешће траже речи у свом канонском облику (номинатив jеднине за ...
... Претраживање без и са морфолошким и семантичко-морфолошким проширењима упита биће приказан на примеру претраживања лексеме хомогенизациjа. Упитом без проширења тражи се само облик номинатива jеднине: хомогенизациjа Упитом са морфолошким проширењем, у претрагу су укључени сви флективни облици тражене ...
... др., „Употреба веб платформе Омека...“, стр. 27–51 речи. Ови упити се састоjе од jедне или више речи, коjе су евентуално повезане логичким операторима „и/или”. Када jе у питању претраживање дигиталне библиотеке, формулисање сложениjих упита jе омогућено преко проширених регуларних израза. У зависности ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... нове типове ентитета. Како семантички маркери, интегрисани у графове, обезбеђују постављање комп- лексних упита за екстракцију конкорданци, то је за специфичне, доменски зависне упите је потребно допунити скуп лексичких маркера. Један од домена који су недавно уведени у српски морфолошки речник ...
... семантички маркер – опрема (или део опреме) Маркере је могуће користити кроз регуларне изразе, за неке једностав- није упите над корпусом. Други вид употребе јесте кроз постављање упита конструкцијом аутомата са сложенијим захтевима. Пример истраживања у коме су коришћени маркери у циљу екстракције ...
... РУДАРСТВА У СРПСКЕ ЕЛЕКТРОНСКЕ РЕЧНИКЕ Семантички маркери у електронским речницима омогућавају постављање комплек- сних упита за екстракцију информација. Када су у питању упити везани за специфични домен, расположиви скуп лексичких маркера за тај конкретни домен од пресудног је зна- чаја за квалитет ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... ROmeka@RGF унапређено је имплементирањем проширених упита. Коришћени су веб сервиси (Станковић и др. 2012) и морфолошки електронски речници за српски језик (Крстев и др. 2008, Станковић 152 BIBLIOINFO и др. 2016) за морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/ vebran/api/delafs/ključna_reč) ...
... a_reč) и семантичко-морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/vebran/api/sinonimi/ključna_reč). 3. Сива литература Значајан део документације похрањене у дигиталној библио- теци ROmeka@RGF представља такозвана сива литература. Она је у библиотечкој литератури дефинисана на различите начине ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... Slika 4-30 Konkordance za upit „rizik … kao što…je“ Iterativnim postupkom se može doći do odgovarajućih upita, naime upit se može prilagoditi da izvuče štete okidačima, recimo „što inicira|prouzrokuje|…“. Dakle potrebne su takve rečenice i odgovarajući upiti kojima će se precizno pronaći koncepti ...
... mogu javiti neke reči ali ne i tačka. prikazuje deo rezultata varijante prethodnog upita za NP0=“proces“ (Slika 4-29). Slika 4-29 Konkordance za upit „72 kao što “ Na osnovu prikazanih rezultata upita možemo dodati u ontologiju sledeće relacije : hyponym ("proces", "čišćenje uglja") ...
... primer upita nad korpusom koji bi odgovarao sličnom obrascu je: [lemma="jesam"][word!="\."]{0,3}[lemma="vrsta"][tag="N"] Analizom rezultata (Slika 4-31) je uočeno da dosta primera za nabrajanja idu sa zagradom tako da se može upit modifikovati u tom smeru. Slika 4-31 Konkordance za upit „je … ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji
Ljiljana R. Kolonja (2016-09-23)Postojeća organizacija zaštite na radu na površinskim kopovima uglja često nije umogućnosti da blagovremeno i tačno ukaže na nedostatke, koji mogu u bližoj ilidaljoj budućnosti da budu uzrok narušavanja bezbednosti radnika, ali i uzrokoštećenja materijalnih dobara rudnika. Nemogućnost donošenja pravovremenihodluka je moguće izbeći uvođenjem softverski podržanih sistema za praćenje ianalizu bezbednosti i zaštite na radu.Osnovni cilj ove doktorske disertacije je definisanje metodologije i razvoj modelasistema upravljanja zaštitom na radu, koji će omogućiti savremen, adekvatan isveobuhvatan način praćenja i analize ...... podataka, SQL upitima za takozvane jednodimenzionalne upite (npr. 5 najstarijih radnika, ili upoređivanje broja povreda u prošloj i tekućoj godini). Analitičke aplikacije podržavaju direktno pretraživanje podataka, ali omogućavaju i kreiranje složenijih, višedimenzionalnih upita sa na primer ...
... e i ekspanziju upita Slika 7.11. prikazuje isečke iz radova koji odgovaraju postavljenom upitu, gde se u prvoj koloni navode podaci o radu iz koje je isečak teksta, u drugoj isečak na engleskom i u trećoj na srpskom. Termini koje je sistem sravnio sa upitom su istaknuti plavom ...
... et al., 2013). Osim toga, višejezičnost ontologije omogućava da upit na jednom jeziku vraća rezultate koji sadrže dokumente koji odgovaraju ključnoj reči upita po svom sadržaju, ali nisu na jeziku inicijalnog upita. 7.4. Višestruka namena Korišćenje ontologije RudOnto za ostvarenje različitih ...Ljiljana R. Kolonja. "Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2016-09-23)
-
Integrisanje heterogenih leksičkih resursa
Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite vrste leksičkih informacija. Integracijom ovih resursa, informacije ...... izgovora (+Ek). Informacije iz sistema rečnika SrpDic mogu se pomoću sistema Intex [1] koristiti za formulisanje kompleksnih upita za pretraživanje tekstova. Na primer, upitom: će se dobiti svi prisvojni pridevi u tekstu koji ne pripadaju ekavskom izgovoru. Zapisi u DELAS rečniku mogu ...
... relacijom ENG_DERIVATIVE. U opštem slučju poslednja veza ne mora da postoji. Semantičke oznake u DELAS zapisima omogućavaju formulisanje kompleksnih upita u Intex okruženju. Korišćenje Intex-ovih regularnih izraza (* ) + ( * ) (imenica označena kao ... Ranka Stanković, Cvetana Krstev, Duško Vitas, Ivan Obradović, Gordana Pavlović-Lažetić. "Integrisanje heterogenih leksičkih resursa" in Festivalski katalog 11. Festivala informatičkih dostignuća INFOFEST 2004, 26th September - 2nd October, 2004, Budva, Montenegro, INFOFEST (2004)
-
Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis
U ovom radu predstavljen je model koji omogućava prikupljanje, pripremu, opis metapodataka, upravljanje i eksploataciju, uključujući pretragu punog teksta dokumenata iz domena kriminalistike napisanih na srpskom jeziku. Predloženi pristup primenjuje se na veb portalu koji sakuplja različite tekstove nastale iz časopisa Akademije za kriminalistiku i policijske studije, Krivičnog zakona Srbije, konferencija „Tara“ i „Reiss“, kao i iz nekih doktorskih disertacija vezanih za ovu oblast istraživanje. Nakon obrade teksta, korpus koji sadrži preko 5500 stranica običnog teksta, kreiran je i ...Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović. "Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis" in International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017, Academy Of Criminalistic And Police Studies Belgrade (2017)
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... означава кулинарску меру и потом именица из кулинарског домена. На слици је приказано радно окружење за задавање обрасца упита и конкорданце добијене као одзив за постављени упит: додај кашику воде, мети кашику масти, намажи главу лимуновим соком и сл., али препознаје и три зрна бибера, јер је три ...
... представљено неколико карактеристичних образаца. Претраживање кулинарског корпуса, осим по облицима и лемама, могуће је коришћењем колмплекснијих упита, представљених регуларним изразима или графовима. Образац облика<+MessApp> проналази глагол (који није помоћни), за којим ... Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i ...standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaciChristian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
-
Vebran Web Services for Corpus Query Expansion
Ranka Stanković, Miloš Utvić (2020)U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.... Eighth International Confer- ence on Language Resources and Evaluation (LREC),(Istanbul, Turkey, 2012, 1710–1717 Stanković, Ranka. “Modeli ekspanzije upita nad tekstuelnim resursima”. Phdthesis, Univerzitet u Beogradu, Matematički fakultet, Beograd, 2009 Stanković, Ranka, Cvetana Krstev, Biljana Lazić ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... малих и средњих предузећа 24 ради на проширивању претраживачких сервиса, али углавном за стране партнере и за енглески језик. У истраживачком окружењу су оављени експери- менти са системима за проширивање упита који су машинама за претраживање слали упите прошири- ване морфолошким речницима и ви ...
... задово- љавајућег одговора треа да се примени синтаксичко парсирање да и се анализирала граматичка струк- 23 корисников упит веб странице припремна обрада анализа упита припремна обрада семантичка обрада индексирање сравњивање и релевантност резултати претраживања 8: Претраживање веба ...
... се „препознавање именованих ен- титета”. Још захтевнији су покушаји сравњивања упита са документима који су записани на различитим јези- цима. За вишејезично проналажење информација потрено је да се аутоматски преведе упит на све мо- гуће изворне језике, а затим да се пронађена инфор- мација преведе ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Managing mining project documentation using human language technology
Purpose: This paper aims to develop a system, which would enable efficient management and exploitation of documentation in electronic form, related to mining projects, with information retrieval and information extraction (IE) features, using various language resources and natural language processing. Design/methodology/approach: The system is designed to integrate textual, lexical, semantic and terminological resources, enabling advanced document search and extraction of information. These resources are integrated with a set of Web services and applications, for different user profiles and use-cases. Findings: The ...Digital libraries, Information retrieval, Data mining, Human language technologies, Project documentationAleksandra Tomašević, Ranka Stanković, Miloš Utvić, Ivan Obradović, Božo Kolonja . "Managing mining project documentation using human language technology" in The Electronic Library (2018). https://doi.org/10.1108/EL-11-2017-0239
-
Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model
Ova studija predstavlja analizu sentimenta srpskih starih romana iz perioda 1840-1920, koristeći veliki jezički model (LLM) Mistral za tehniku učenja sa zasnovani na takozvanim "zero" i "few-shot" pokušajima. Glavni pristup uvodi inovacije osmišljavanjem istraživačkih upita (promptova) uključuju tekst sa uputstvom za klasifikaciju bez primera i na osnovu nekoliko primera, omogućavajući jezičkom modelu da klasifikuje osećanja u pozitivne, negativne ili objektivne kategorije. Ova metodologija ima za cilj da pojednostavi analizu osećanja ograničavanjem odgovora, čime se povećava preciznost ...Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević. "Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation, Sofia, Bulgaria, 9-10 September 2024, LREC | COLING (2024)
-
Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking
U radu se prikazuju rezultati istraživanja vezanih za pripremu paralelnih korpusa, fokusirajući se na transformaciju u RDF grafove koristeći NLP Interchange Format (NIF) za lingvističku anotaciju. Pružamo pregled paralelnog korpusa koji je korišćen u ovom studijskom slučaju, kao i proces označavanja delova govora, lematizacije i prepoznavanja imenovanih entiteta (NER). Zatim opisujemo povezivanje imenovanih entiteta (NEL), konverziju podataka u RDF, i uključivanje NIF anotacija. Proizvedene NIF datoteke su evaluirane kroz istraživanje triplestore-a korišćenjem SPARQL upita. Na kraju, razmatra se povezivanje Linked ...paralelni korpusi, povezivanje imenovanih entiteta, prepoznavanje imenovanih entiteta, NER, NEL, povezani podaci, NIF, VikipodaciRanka Stanković, Milica Ikonić Nešić, Olja Perisic, Mihailo Škorić, Olivera Kitanović. "Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)
-
SrpELTeC: A Serbian Literary Corpus for Distant Reading
U članku je predstavljen SrpELTeC, korpus razvijen u okviru akcije COST Distant Reading for European Literary History (CA16204). Svi romani u SrpELTeC-u su odabrani, pripremljeni i obeleženi korišćenjem zajedničkih principa uspostavljenih za sve jezičke zbirke u Evropskoj zbirci književnog teksta (ELTeC). Navedeni su izazovi i rešenja u pripremi SrpELTeC od nule. Svi romani su ručno kodirani u TEI sa bogatim metapodacima i strukturnim napomenama. Automatska anotacija je uključivala POS-označavanje, lematizaciju i imenovane entitete, oslanjajući se na resurse za obradu ...digital humanities, Serbian literature, text corpora, distant reading , linked data, named entity recognition, text analyticsRanka Stanković, Cvetana Krstev, Duško Vitas. "SrpELTeC: A Serbian Literary Corpus for Distant Reading" in Primerjalna književnost, Research Centre of the Slovenian Academy of Sciences and Arts (2024). https://doi.org/10.3986/pkn.v47.i2.03
-
Praktikum za vežbe iz Informatike 1
Ranka Stanković, Ivan Obradović, Olivera Kitanović, Mirjana Banković. Praktikum za vežbe iz Informatike 1, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2014
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... користи онтологију хране за репрезентацију знања, као и друге напредне информатичке технологије, за развој врло успешног система који, на корисников упит нуди рецепте из своје базе, а ако такви не постоје систем модификује неке постојеће (Кордије и др. 2014). Као што је случај и са другим језичким ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)