Tema 1 – Københavns Universitet

CST > Projekter > DIGHUMLAB > Tema 1

Tema 1 - Sprogbaserede materialer og værktøjer

Målsætning

Under temaet "Sprogbaserede materialer og værktøjer" har alle aktiviteterne som målsætning at bidrage til: 

  • At udbygge og konsolidere en dansk forskningsinfrastruktur for humaniora ved at identificere og inkludere sprogbaserede materialer og værktøjer i den eksisterende danske CLARIN-platform og ved at støtte skabelsen og udviklingen af nye materialer og værktøjer til at udføre forskningen med.
  • At udbrede kendskabet til forskningsinfrastrukturen blandt danske humanistiske forskere ved dels selv at udbyde og dels bidrage til andre udbyderes ph.d.-kurser, workshopper, seminarer og træningskurser for forskere og studerende.
  • At opfylde Danmarks kontraktlige forpligtelser som en af grundlæggerne af den europæiske ERIC (European Research Infrastructure Consortium), CLARIN.

Aktiviteter

Sprogbaserede materialer og værktøjer er overskriften på den ene af de tre overordnede arbejdspakker, kaldet temaer, under det nationale initiativ DIGHUMLAB, Digitalt Humaniora Laboratorium, som skal være en fælles forskningsinfrastruktur for humaniora i Danmark.

Målsætningen for arbejdspakken om sprogbaserede materialer og værktøjer er:

1) At gennemføre en kortlægning af de sprogbaserede materialer og værktøjer, som allerede findes på danske universiteter og andre forskningsinstitutioner, som arbejder med sprogbaserede materialer. Formålet med kortlægningen er at identificere materialer med henblik på udvælgelse i overensstemmelse med relevante kriterier af typen, hvilke materialer findes der, hvad efterspørger brugerne (forskerne), og hvilke typer af materialer er især velegnede til trænings- og uddannelsesformål.

2) At anvende resultaterne af kortlægningen til at udvælge materialer, gerne af alle typer, til den første runde af inkludering på den eksisterende danske CLARIN-platform. For at kunne blive inkluderet og dermed tilgængelige for alle danske forskere kræver det, at data skal renses, ordnes, konverteres, forsynet med metadata og evt. anden opmærkning og forsynet med en licens, som brugerne skal acceptere for at få adgang til data. Dette vil føre til et øget volumen af indhold, som deles gennem infrastrukturen, og dette forventes at gøre det mere attraktivt for for flere forskere at bruge og bidrage til forskningsinfrastrukturen. Det vil være nødvendigt, at ejerne af de udvalgte materialer kan bidrage til processen med at klargøre data i form af medfinansiering.

3) At planlægge og gennemføre efterfølgende runder af inkludering af udvalgte materialer.

4) At indgå en aftale med CLARIN ERIC, som beskriver i detaljer, hvori det danske CLARIN-bidrag, der kommer fra DIGHUMLAB generelt, består specifikt de sprogbaserede materialer og værktøjer.

5) At arbejde for etableringen af et dansk data center med henblik på at kunne få det godkendt som et "type B"-center i forhold til CLARIN ERIC. Dette er en af de betingelser, Danmark har skrevet under på at ville opfylde som medlem af denne europæiske forskningsinfrastruktur.

6) At fortsætte udviklingen af den tekniske danske CLARIN infrastruktur-platform og gøre den i stand til både at kunne rumme flere typer af materialer og værktøjer og at præsentere materialerne og de værktøjer, der skal anvendes til at bearbejde dem og forske i dem på de måder, som forskerne har behov for. En måde kunne fx være visualisering.

7) At samarbejde med de nuværende partnere i de andre temaer i DIGHUMLAB omkring inklusion af deres data på CLARIN-platformen, hvis de ønsker det, og ligeledes at samarbejde og søge at inkludere flere partnere, fx biblioteker og andre forskningsinstitutioner under Kulturministeriet.

8) At bidrage til at udbrede viden om infrastrukturen til et bredere publikum.

9) At arbejde for at sikre driften af forskningsinfrastrukturen på langt sigt efter 2016.