Culture-Sensitive Assessment and Adjustment of Large Language Models – Adaptation to the Nordic-Baltic Societies (CAALLM)

Formålet med projektet er at bidrage til en tilpasning af store sprogmodeller hen mod en mere ansvarlig dækning og funktionalitet, der mere præcist repræsenterer Nordens og Baltikums sproglige, kulturelle og samfundsmæssige mangfoldighed.

Projektet samler et antal sproginstitutioner og NLP-forskningsgrupper i Norden og Baltikum og vil udarbejde en række åbne, multiparallelle datasæt, både sproglige og kulturelle, for dansk, svensk, bokmål, nynorsk, færøsk og lettisk. Datasættene vil indbefatte udvalgte centrale aspekter af regionens sproglige og kulturelle karakteristika i, såsom vores måde at udtrykke os på i form af metaforer og faste udtryk, samt vores værdier og normer i relation til fx tillid, lighed og demokrati. Med udgangspunkt i disse data håber vi at kunne udvikle avancerede metoder til at forstå, vurdere og tilpasse store sprogmodeller på tværs af sprog og kulturer, med særligt fokus på regionens sproglige og kulturelle særpræg.

 

Færøernes Universitet

Oslo Universitet

Göteborg Universitet

Det Danske Sprog- og Litteraturselskab

Letland Universitet

 

Forskere

Navn Titel
Ali Basirat Lektor Billede af Ali Basirat
Bolette Sandford Pedersen Professor, viceinstitutleder Billede af Bolette Sandford Pedersen
Sussi Olsen Akademisk medarbejder FU Billede af Sussi Olsen

Finansiering

Projektet er finansieret af NordForsk.

Projektperiode: Marts 2026 – February 2029

PI: Bolette Sandford Pedersen