DIGHUMLAB
DIGHUMLAB står for Digitalt Humaniora Laboratorium. DIGHUMLAB er et dansk initiativ inden for forskningsinfrastruktur for humaniora. Formålet er at facilitere digitalt humaniora i dansk forskning for derigennem at fremme mere tværfagligt og tværdisciplinært samarbejde og mere udstrakt videndeling og global orientering af både forskning og uddannelse.
Sprogbaserede materialer og værktøjer
Arbejdet er organiseret i tre temaer, som du kan læse mere om på DIGHUMLABs hjemmeside.
Center for Sprogteknologi har ansvaret for Tema 1 – Sprogbaserede materialer og værktøjer, som den danske CLARIN infrastruktur er en del af. Læs mere om CLARIN-DK.
Målsætning
Under temaet "Sprogbaserede materialer og værktøjer" har alle aktiviteterne som målsætning at bidrage til:
- At udbygge og konsolidere en dansk forskningsinfrastruktur for humaniora ved at identificere og inkludere sprogbaserede materialer og værktøjer i den eksisterende danske CLARIN-platform og ved at støtte skabelsen og udviklingen af nye materialer og værktøjer til at udføre forskningen med.
- At udbrede kendskabet til forskningsinfrastrukturen blandt danske humanistiske forskere ved dels selv at udbyde og dels bidrage til andre udbyderes ph.d.-kurser, workshopper, seminarer og træningskurser for forskere og studerende.
- At opfylde Danmarks kontraktlige forpligtelser som en af grundlæggerne af den europæiske ERIC (European Research Infrastructure Consortium), CLARIN.
Sprogbaserede materialer og værktøjer er overskriften på den ene af de tre overordnede arbejdspakker, kaldet temaer, under det nationale initiativ DIGHUMLAB, Digitalt Humaniora Laboratorium, som skal være en fælles forskningsinfrastruktur for humaniora i Danmark.
Målsætningen for arbejdspakken om sprogbaserede materialer og værktøjer er:
1) At gennemføre en kortlægning af de sprogbaserede materialer og værktøjer, som allerede findes på danske universiteter og andre forskningsinstitutioner, som arbejder med sprogbaserede materialer. Formålet med kortlægningen er at identificere materialer med henblik på udvælgelse i overensstemmelse med relevante kriterier af typen, hvilke materialer findes der, hvad efterspørger brugerne (forskerne), og hvilke typer af materialer er især velegnede til trænings- og uddannelsesformål.
2) At anvende resultaterne af kortlægningen til at udvælge materialer, gerne af alle typer, til den første runde af inkludering på den eksisterende danske CLARIN-platform. For at kunne blive inkluderet og dermed tilgængelige for alle danske forskere kræver det, at data skal renses, ordnes, konverteres, forsynet med metadata og evt. anden opmærkning og forsynet med en licens, som brugerne skal acceptere for at få adgang til data. Dette vil føre til et øget volumen af indhold, som deles gennem infrastrukturen, og dette forventes at gøre det mere attraktivt for for flere forskere at bruge og bidrage til forskningsinfrastrukturen. Det vil være nødvendigt, at ejerne af de udvalgte materialer kan bidrage til processen med at klargøre data i form af medfinansiering.
3) At planlægge og gennemføre efterfølgende runder af inkludering af udvalgte materialer.
4) At indgå en aftale med CLARIN ERIC, som beskriver i detaljer, hvori det danske CLARIN-bidrag, der kommer fra DIGHUMLAB generelt, består specifikt de sprogbaserede materialer og værktøjer.
5) At arbejde for etableringen af et dansk data center med henblik på at kunne få det godkendt som et "type B"-center i forhold til CLARIN ERIC. Dette er en af de betingelser, Danmark har skrevet under på at ville opfylde som medlem af denne europæiske forskningsinfrastruktur.
6) At fortsætte udviklingen af den tekniske danske CLARIN infrastruktur-platform og gøre den i stand til både at kunne rumme flere typer af materialer og værktøjer og at præsentere materialerne og de værktøjer, der skal anvendes til at bearbejde dem og forske i dem på de måder, som forskerne har behov for. En måde kunne fx være visualisering.
7) At samarbejde med de nuværende partnere i de andre temaer i DIGHUMLAB omkring inklusion af deres data på CLARIN-platformen, hvis de ønsker det, og ligeledes at samarbejde og søge at inkludere flere partnere, fx biblioteker og andre forskningsinstitutioner under Kulturministeriet.
8) At bidrage til at udbrede viden om infrastrukturen til et bredere publikum.
9) At arbejde for at sikre driften af forskningsinfrastrukturen på langt sigt efter 2016.
Aarhus Universitet (projektleder)
Københavns Universitet, Center for Sprogteknologi, Institut for Nordiske Studier og Sprogvidenskab
Syddansk Universitet
Aalborg Universitet
Det Kongelige Bibliotek
Statsbiblioteket
Forskere
Navn | Titel | Telefon | |
---|---|---|---|
Bart Jongejan | Softwareudvikler | +4535329075 | |
Costanza Navarretta | Seniorforsker | +4535329079 | |
Dorte Haltrup Hansen | Akademisk medarbejder FU | +4535329070 | |
Simon Gray | Forskningsfuldmægtig | +4535337688 | |
Sussi Olsen | Akademisk medarbejder FU | +4535329064 |
Kontakt
Costanza Navarretta
National CLARIN-koordinator
Seniorforsker
Institut for Nordiske Studier og Sprogvidenskab
Københavns Universitet