Moje raziskovalno, strokovno in pedagoško delo poteka
na področju shranjevanja in iskanja informacij (information retrieval -
IR). Ukvarjam se z različnimi vidiki gradnje tekstovnih podatkovnih zbirk
in iskalnikov, ki delujejo na teh zbirkah. Predvsem me zanima avtomatsko
indeksiranje slovenskih strokovnih besedil v omrežnem okolju. O teh temah
tudi vodim vaje in predavam na Medicinski in Filozofski fakulteti. Od diplome
na Oddelku za biologijo Biotehniške fakultete leta 1981 sem zaposlen na
Medicinski fakulteti, Inštitutu za biostatistiko in medicinsko informatiko (IBMI),
od devetdesetih let pa honorarno predavam tudi na Oddelku za bibliotekarstvo
Filozofske fakultete.
JD, drugi z leve
Raziskovalno delo
Raziskave in razvoj krnilnikov Krnilniki (stemmers) so programi, ki v postopku krnjenja za različne
oblike neke besede določijo niz znakov (krn), ki lahko v zbirki predstavlja
vse oblike te besede in samo oblike te besede. Krnjenje je med najpomembnejšimi
postopki avtomatskega indeksiranja, še posebno pri jezikih z bogato morfologijo,
kakršna je slovenščina. Ukvarjam se s krnjenjem slovenščine.
Nekatere moje publikacije, povezane z razvojem krnilnikov in dostopne
na spletu:
Raziskave in razvoj iskalnika Matador Matador (Multilingual testbed for document retrieval) je skupno ime
za nekaj zaporednih projektov, namenjenih raziskavam in razvoju zbirk in
iskalnikov polnih dokumentov. V slovenski medicini prevladujejo znanstveni
in strokovni dokumenti v slovenščini in angleščini, zato so raziskave posvečene
avtomatskemu indeksiranju in iskanju dokumentov v teh jezikih.
Nekatere moje publikacije, povezane s sistemom Matador in dostopne
na spletu:
Dimec J, Džeroski S, Todorovski L, Hristovski D. Iskalnik
za slovenske in angleške dokumente na svetovnem spletu. In: Erjavec
T, Gros J, editors. Zbornik konference Jezikovne tehnologije za slovenski
jezik: mednarodna multi-konferenca Informacijska družba - IS'98; 1998 okt
6-7; Ljubljana, Slovenija. Ljubljana: Institut Jožef Stefan, 1998; 42-8.
Dimec J, Todorovski L, Hristovski D, Džeroski S. The
personalised search engine for Slovenian and English medical documents.
In: Žumer M, Goossens P, editors. Managing multimedia collections. 23rd
library systems seminar of the European library automation group ELAG,
1999 Apr 21-23; Bled. Ljubljana: National and university library, 1999;
56-63.
Razvoj zbirke medicinskih slik K splošni usmeritvi IBMI sodi tudi ponudba e-verzij
medicinskih dokumentov, pomembnih za strokovno in pedagoško delo, med drugim
tudi zbirk slikovnega materiala. Sodeloval sem pri razvoju Atlasa
kožnih in spolnih bolezni.
Medjezično iskanje Prepričan sem, da je medjezično iskanje (Cross-language information
retrieval, CLIR) raziskovalno področje, ki je še posebno pomembno za strokovna
okolja "majhnih" jezikov, kakrąna je slovenščina. Tu
je moj članek na to temo, ki je objavljen v reviji Knjižnica, št. 1-2,
2002.
Strokovno delo
Biomedicina Slovenica Od leta 1981 sodelujem pri gradnji nacionalne
bibliografske zbirke Biomedicina Slovenica, predvsem z razvojem programske
opreme, namenjene vnosu, popravljanju podatkov in izdelavi izpisov. Programska
oprema temelji na sistemu Oracle in programskem jeziku PL/SQL. Spletni
vmesnik do zbirke (avtor Mitko Hristovski) je dostopen tule.
Razvoj programske opreme za avtomatsko
generiranje e-revij Največ težav pri postavljanju spletnih verzij
revij predstavlja zagotavljanje strukturne in oblikovne enotnosti člankov
in številk revije ter hipertekstno povezovanje člankov ali delov člankov
v posamezni številki. V programskem jeziku Java sem razvil programsko opremo,
ki to delo močno poenostavlja in pospešuje. Z njo so bile postavljene naslednje
revije:
Acta
dermatovenerologica Alpina, Pannonica et Adriatica,
ISIS,
JAMA
(Slovenska verzija).