Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
Објеката
- Тип
- Рад у зборнику
- Верзија рада
- објављена
- Језик
- енглески
- Креатор
- Christian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset
- Извор
- Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024
- Уредник
- Nicoletta Calzolari, Min-Yen Kan, Veronique Hoste, Alessandro Lenci, Sakriani Sakti, Nianwen Xue
- Издавач
- LREC
- COLING
- Датум издавања
- 2024
- Сажетак
- OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i koligacija. Primarna oblast primene proširenja upita je digitalna leksikografija i korpusna lingvistika, i mi predstavljamo implementaciju koncepta u serverskim (backend) komponentama novog sistema projektovanog da podrži digitalnu leksikografiju za srpski jezik.
- OntoLex, the dominant community standard for machine-readable lexical resources in the context of RDF, Linked Data and Semantic Web technologies, is currently extended with a designated module for Frequency, Attestations and Corpus-based Information (OntoLex-FrAC). We propose a novel component for OntoLex-FrAC, addressing the incorporation of corpus queries for (a) linking dictionaries with corpus engines, (b) enabling RDF-based web services to exchange corpus queries and responses data dynamically, and (c) using conventional query languages to formalize the internal structure of collocations, word sketches, and colligations. The primary field of application of the query extension is in digital lexicography and corpus linguistics, and we present a proof-of-principle implementation in backend components of a novel platform designed to support digital lexicography for the Serbian language.
- почетак странице
- 2504
- крај странице
- 2514
- Subject
- standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaci
- standardization, digital lexicography, OntoLex, corpus querying, Linked Data, Linguistic Linked Open Data
- Шира категорија рада
- М30
- Ужа категорија рада
- М33
- Је дио
- TESLA
- Права
- Отворени приступ
- Лиценца
- Creative Commons – Attribution-Share Alike 4.0 International
- Формат
- Медија
- 2024.lrec-main.225.pdf
Christian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
This item was submitted on 25. мај 2024. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: https://dr.rgf.bg.ac.rs/s/repo
Click here to view the collected data.