Automatisk resumering af videnskabelige dokumenter – Københavns Universitet

Brugervenligt værktøj til automatisk resumering af videnskabelige dokumenter

Center for Sprogteknologi (CST) præsenterer her DanSum - et redskab til automatisk resumering på https://cst.dk/defsum/, som er udviklet i samarbejde med Kungliga Tekniska Høgskolan (KTH) i Stockholm. CST's arbejde er udført inden for projektet DefSum der er støttet af Danmarks Elektroniske Forskningsbibliotek (DEF).

DefSum-projektets formål har været at udvikle et værktøj der kan anvendes til automatisk resumering af videnskabelige dokumenter. Ved hjælp af tekstresumering vil det med tiden blive muligt at overskue og finde præcis og relevant information uden alt for store omkostninger.

I DefSum skal værktøjet(DanSum) i første omgang bruges til at gøre information om sprogteknologi tilgængelig for forskere, studerende, udviklere mm. på DanDokCenters hjemmeside, en hjemmeside der er et virtuelt informationscenter om sprogteknologi i Danmark. På længere sigt skal resumeringen indgå i større systemer til dokumenthåndtering, automatisk indeksering og søgning.

Konkret har projektet handlet om at lave en dansk version af det svenske system SweSum ved dels at tilpasse den danske SprogTeknologiske Ordbase (STO) til systemet og dels at indføre forskellige danske sprogteknologiske værktøjer (som fx POS-tagger, lemmatiser og evt. navnegenkender) i systemet.

Resumeringsværktøjet kan afprøves her

Yderligere information findes her

CST’s projektansvarlige:  Jürgen Wedekind, e-mail : juergen@cst.dk