Benchmarkprojektet

Udformning af et benchmark til at evaluere danske sprogmodeller

Projektet går ud på at opstille et benchmark med en række evalueringsdatasæt der kan bruges til at undersøge graden af sprogforståelse i store sprogmodeller der arbejder på dansk. Der tages især udgangspunkt i danske semantiske ordbøger som Den Danske Begrebsordbog, DanNet, Dansk FrameNet Leksikon, Det Danske Sentimentleksikon og Det Centrale OrdRegister, og datasættene udvikles bl.a. semiautomatisk ud fra disse.

Partner

Det Danske Sprog- og Litteraturselskab

Datasæt

Evalueringsdatasættene er tilgængelige på github og udvikles løbende. 

 

 

 

Morten Mikkelsen. (30-08-2024). Chatbotter skal også forstå sprogets danske sjæl. Kristeligt Dagblad. Interview med Bolette S. Pedersen og Nathalie Hau Sørensen.

Pedersen, B. S., Sørensen, N. C. H., Olsen, S., & Nimb, S. (2024). Evaluering af sprogforståelsen i danske sprogmodeller – med udgangspunkt i semantiske ordbøger. NyS - Nydanske Sprogstudier, 65, 8-40. [1].

Pedersen, B. S., Sørensen, N. C. H., Olsen, S., Nimb, S., & Gray, S. (2024). Towards a Danish Semantic Reasoning Benchmark - Compiled from Lexical-Semantic Resources for Assessing Selected Language Understanding Capabilities of Large Language Models. I Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (s. 16356). ELRA and ICCL.

 

 

  • Workshop on NLU benchmark datasets for Danish, Center for Sprogteknologi, 12. Marts 2024.
  • Benchmarking Workshop, Digitaliseringsstyrelsen  20 september 2024.

 

Deltagere

Interne

Navn Titel Telefon E-mail
Gray, Simon Forskningsfuldmægtig +4535337688 E-mail
Hansen, Dorte Haltrup Akademisk medarbejder FU +4535329070 E-mail
Olsen, Sussi Akademisk medarbejder FU +4535329064 E-mail
Pedersen, Bolette Sandford Professor, Viceinstitutleder +4535329078 E-mail
Schneidermann, Nina Skovgaard Videnskabelig assistent +4535331600 E-mail

Eksterne

Navn Titel E-mail
Nimb, Sanni  Seniorredaktør, Det Danske Sprog- og Litteraturselskab E-mail
Sørensen, Nathalie C. Hau Assisterende redaktør, Det Danske Sprog- og Litteraturselskab E-mail

Støttet af

Carlsbergfondet

Titel: Compiling a Danish Benchmark Dataset for Assessing Selected Reasoning Capabilities of Large Language Models

Projektperiode: 1. februar 2024 – 1. februar 2026

PI: Bolette Sandford Pedersen