Skip to main content
Пријава

Collected Item: “Annotation of the Serbian ELTeC Collection”

Врста публикације

Рад у часопису

Верзија рада

објављена верзија

Језик рада

енглески

Аутор/и (Милан Марковић, Никола Николић)

Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić

Наслов рада (Наслов - поднаслов)

Annotation of the Serbian ELTeC Collection

Наслов часописа

Infotheca

Издавач (Београд : Просвета)

Faculty of Philology, University of Belgrade

Година издавања

2021

Сажетак на српском језику

Ovaj rad predstavlja takozvano izdanje nivoa 2 kolekcije tekstova SrpELTeC razvijene u okviru aktivnosti Radne grupe 2 – Metode i alati COST akcije CA 16204 (Distant Reading for European Literary History) i njene specifikacije šeme. Izdanje nivoa 2 je nastavak izdanja nivoa 1, koje se koristi kao ulaz za morfosintaksičke i NER anotacije romana. Srpska obrada nivoa-2 je navedena kroz potrebne korake, uključujući metode i alate koji se koriste u tom procesu. Neki statistički podaci iz srpske kolekcije nivoa 2 ELTeC-a daju zanimljiv uvid u sadržaj kolekcije.

Сажетак на енглеском језику

This paper presents the so-called level-2 edition of SrpELTeC collection developed within the activities of Working Group 2 - Methods and Tools of the COST Action CA 16204 (Distant Reading for European Literary History), and its schema specification. The level-2 edition is a follow-up of the level-1 edition, which is used as input for morphosyntactic and NER annotation of novels. The Serbian level-2 pipeline outlines steps required for production of level-2, including methods and tools used in the process. Some statistics drawn from the Serbian ELTeC level-2 sub-collection brings an interesting insight into collection content.

Волумен/том или годиште часописа

21

Број часописа

2

Почетна страна

43

Завршна страна

59

DOI број

10.18485/infotheca.2021.21.2.3

ISSN број часописа

1450-9687

Кључне речи на српском (одвојене знаком ", ")

udaljeno čitanje, literarni korpus, tagiranje, prepoznavanje imenovanih entiteta, lematizacija, ELTeC

Кључне речи на енглеском (одвојене знаком ", ")

distant reading, literary corpus, tagging, NER, lemmatization, ELTeC

Линк

http://dx.doi.org/10.18485/infotheca.2021.21.2.3

Шира категорија рада према правилнику МПНТ

M50

Ужа категорија рада према правилнику МПНТ

М51

Степен доступности

Отворени приступ

Лиценца

Creative Commons – Attribution 4.0 International

Формат дигиталног објекта

.pdf
Click here to view the corresponding item.