Institut for Nordiske Studier og Sprogvidenskab

Benchmarkprojektet

Udformning af et benchmark til at evaluere danske sprogmodeller

Projektet går ud på at opstille et benchmark med en række evalueringsdatasæt der kan bruges til at undersøge graden af sprogforståelse i store sprogmodeller der arbejder på dansk. Der tages især udgangspunkt i danske semantiske ordbøger som Den Danske Begrebsordbog, DanNet, Dansk FrameNet Leksikon, Det Danske Sentimentleksikon og Det Centrale OrdRegister, og datasættene udvikles bl.a. semiautomatisk ud fra disse.

Partner

Det Danske Sprog- og Litteraturselskab

Datasæt

Evalueringsdatasættene er tilgængelige på github og udvikles løbende.

Publikationer og presse

Pedersen, Bolette Sandford et al. "Evaluating LLM-Generated Explanations of Metaphors –: A Culture-Sensitive Study of Danish". NEALT (Northern European Association of Language Technology) Proceedings Series. 2025, 470-479.

Morten Mikkelsen. (30-08-2024). Chatbotter skal også forstå sprogets danske sjæl. Kristeligt Dagblad. Interview med Bolette S. Pedersen og Nathalie Hau Sørensen.

Pedersen, B. S., Sørensen, N. C. H., Olsen, S., & Nimb, S. (2024). Evaluering af sprogforståelsen i danske sprogmodeller – med udgangspunkt i semantiske ordbøger. NyS - Nydanske Sprogstudier, 65, 8-40. [1].

Pedersen, B. S., Sørensen, N. C. H., Olsen, S., Nimb, S., & Gray, S. (2024). Towards a Danish Semantic Reasoning Benchmark - Compiled from Lexical-Semantic Resources for Assessing Selected Language Understanding Capabilities of Large Language Models. I Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (s. 16356). ELRA and ICCL.

Arrangementer

Workshop on NLU benchmark datasets for Danish, Center for Sprogteknologi, 12. Marts 2024.
Benchmarking Workshop, Digitaliseringsstyrelsen 20 september 2024.

Deltagere

Interne

Navn	Titel	Telefon	E-mail
Gray, Simon	Specialkonsulent	+4535337688	E-mail
Norman, Nathalie Carmen Hau	Ph.d.-stipendiat	+4535331047	E-mail
Olsen, Sussi	Akademisk medarbejder FU	+4535329064	E-mail
Pedersen, Bolette Sandford	Professor, viceinstitutleder	+4535329078	E-mail

Eksterne

Navn	Titel	E-mail
Nimb, Sanni	Seniorredaktør, Det Danske Sprog- og Litteraturselskab	E-mail

Støttet af

Titel: Compiling a Danish Benchmark Dataset for Assessing Selected Reasoning Capabilities of Large Language Models

Projektperiode: 1. februar 2024 – 1. februar 2026

PI: Bolette Sandford Pedersen

Datamanagementplan

Plan for opbevaring af data fra Benchmark-projektet løbende og efter projektets afslutning.

Center for Sprogteknologi