Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis

Објеката

Тип
Рад у зборнику
Верзија рада
рецензирана
Језик
енглески
Креатор
Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović
Извор
International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017
Издавач
Academy Of Criminalistic And Police Studies Belgrade
Датум издавања
2017
Сажетак
U ovom radu predstavljen je model koji omogućava prikupljanje, pripremu, opis metapodataka, upravljanje i eksploataciju, uključujući pretragu punog teksta dokumenata iz domena kriminalistike napisanih na srpskom jeziku. Predloženi pristup primenjuje se na veb portalu koji sakuplja različite tekstove nastale iz časopisa Akademije za kriminalistiku i policijske studije, Krivičnog zakona Srbije, konferencija „Tara“ i „Reiss“, kao i iz nekih doktorskih disertacija vezanih za ovu oblast istraživanje. Nakon obrade teksta, korpus koji sadrži preko 5500 stranica običnog teksta, kreiran je i pripremljen za publikaciju kao mrežni resurs za pretragu punog teksta korišćenjem Omeka, sistema za upravljanje sadržajem otvorenog koda za razvoj digitalne biblioteke u mreži. Mogućnosti pretraživanja, i pretraživanje punog teksta i metapodataka, prilagođavaju se i poboljšavaju proširenjem upita putem veb servisa koji se prenosi na morfološkom rečniku Srbije i srpskoj semantičkoj mreži VordNet za pružanje morfološkog i semantičkog proširenja pretraživanja teksta. U radu su navedene mogućnosti za dalju upotrebu i analizu digitalne biblioteke kao korpusa, anotiranje, tagovane, klasifikaciju dokumenata i klasteroovanja, kao i analize osećanja sa prvim rezultatima u tom smeru.
This paper presents a model that provides harvesting, preparation, metadata description, management and exploitation including full text search over documents from a domain of criminalistics written in Serbian. Proposed approach is applied in a web portal that collects various texts derived from journals of The Academy of Criminalistics and Police Studies, Criminal code of Serbia, the “Tara” and “Reiss” conferences, and from some of PhD dissertations related to this field of research. After text processing, a corpus containing over 5500 pages of plain text is created and prepared for publication as an online resource for full text search using Omeka, an open source content management system for on line digital library development. Search capabilities, both full text and metadata search are customized and improved by query expansion via web service relaying on the Serbian morphological dictionary and the Serbian WordNet semantic network for providing morphological and semantic text search expansion. The paper outlines possibilities for further use and analysis on a digital library as a corpus, annotation, tagging, document classification and clustering, as well as sentiment analysis with first results in that direction.
почетак странице
169
крај странице
180
isbn
ISBN 978-86-7020-387-7
Subject
Omeka, Wordnet, pretraga punog teksta, morfološka i semantička pretraga teksta, proširenje upita
Omeka, WordNet, full text search, morphological and semantic text search, query expansion
Шира категорија рада
М30
Ужа категорија рада
М33
Права
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат
.pdf

Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović. "Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis" in International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017, Academy Of Criminalistic And Police Studies Belgrade (2017)

This item was submitted on 16. март 2020. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: https://dr.rgf.bg.ac.rs/s/repo

Click here to view the collected data.