Centralt OrdRegister for dansk

Centralt OrdRegister for dansk (COR) er et samarbejdsprojekt mellem Det Danske Sprog- og Litteraturselskab, Dansk Sprognævn, CST og Digitaliseringsstyrelsen om at udvikle en fælles dansk sprogressource til AI-formål. Formålet med projektet er dels at støtte en effektiv deling af danske sprogressourcer, dels at stille et betydningsinventar for danske ord (lemmaer) til rådighed for virksomheder og forskere der arbejder med AI. COR indarbejder og opgraderer bl.a. ressourcer der tidligere er udviklet ved CST og DSL såsom det danske wordnet DanNet, Dansk FrameNet og Dansk Sentimentleksikon.

Den semantiske del af det centrale ordregister - COR.SEM - er nu klar. Den kan tilgås fra ordregister.dk ligesom de øvrige COR-ressourcer eller fra corsem.dsl.dk, hvorfra man har mulighed for at udføre mange forskellige søgninger i ressourcen samt downloade hele eller dele af den. 

Partnere i projektet

  • Digitaliseringsstyrelsen
  • Dansk Sprognævn
  • Det Danske Sprog- og Litteraturselskab
  • Københavns Universitet, NorS, Center for Sprogteknologi

Projektet ledes af de fire partnere i fællesskab.

 

Publikationer 

Diderichsen, C., Henrichsen, P. J., Widmann, T. (2022) Det Centrale Ordregister. I Nyt Fra Sprognævnet. Oktober 2022. ISSN 2446-3124. 

Henrichsen, P. J. (2024). Det Centrale Ordregister: et indeks for det danske ordforråd – en gave til dansk sprogteknologi. I Nordiske Studier i Leksikografi 16 (Den 16:e konferensen om lexikografi i Norden), Lund Universitet. 

Henrichsen, P. J. (2023) Diktaroriske Befølelser: Om ord og uord i Det Centrale Ordregister. I Proceedings of MUDS19 (19. Møde om Udforskningen af Dansk Sprog). Aarhus Universitet.

Pedersen, B. S., Nimb, S., Sørensen, N. C. H., Olsen, S., Flörke, I., & Troelsgaard, T. (2023). Reusing the Danish WordNet for a New Central Word Register for Danish. I Proceedings of Global WordNet Conference 2023, Association for Computational Linguistics (ACL).

Nimb, S., Pedersen, B. S., Sørensen, N. C. H., Flörke, I., Olsen, S., & Troelsgaard, T. (2022). COR-S – den semantiske del af Det Centrale OrdRegister (COR). LexicoNordica29, 75-97. https://tidsskrift.dk/lexn/article/view/134776

Pedersen, B. S., Sørensen, N. C. H., Nimb, S., Flørke, I., Olsen, S., & Troelsgård, T. (2022). Compiling a Suitable Level of Sense Granularity in a Lexicon for AI Purposes: The Open Source COR-Lexicon. I Proceedings of the 13th Language Resources and Evaluation Conference, Marseille, France (s. 51-60). European Language Resources. Association. https://doi.org/http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.6.pdf

Pedersen, B. S., Nimb, S., & Olsen, S. (2022). Leksikalsk-semantiske sprogressourcer: Hvad kan de, og hvordan udvikler vi dem bedst? I LIVE and LEARN: Festschrift in honor of Lars Borin (s. 115-121). GU-ISS: Gøteborg Universitetsforlag. https://gupea.ub.gu.se/handle/2077/74254

Widmann, T. (2023) Det Centrale Ordregister (COR): Hvad, hvor, hvorfor og hvordan? I Rapport fra MUDS19  (19. Møde om Udforskningen af Dansk Sprog). Aarhus Universitet.

Widmann, T. (2024) "Det Centrale Ordregister og dets leksikografiske anvendelser". I Nordiske Studier i Leksikografi 16 (Den 16:e konferensen om lexikografi i Norden), Lund Universitet.

Presse

Lotte Thorsen: Nu bliver alle danske ord udstyret med et nummer, Politiken 5. januar 2023.
https://politiken.dk/kultur/art9148822/Nu-bliver-alle-danske-ord-udstyret-med-et-nummer

Deltagere fra Københavns Universitet

Navn Titel Telefon E-mail
Bolette Sandford Pedersen Professor, Viceinstitutleder +4535329078 E-mail
Simon Gray Forskningsfuldmægtig +4535337688 E-mail
Sussi Olsen Akademisk medarbejder FU +4535329064 E-mail

Støttet af

Digitaliseringsstyrelsen logo

Projektet er bevilget af Projektet er bevilget af fællesoffentlige midler via Digitaliseringsstyrelsen.

Projektbeløb: 5.189.970 kr. i alt.

Projektperiode: marts 2021 til december 2023.

Kontakt

KU-projektleder
Bolette Sandford Pedersen
Professor,  viceinstitutleder
Institut for Nordiske Studier og Sprogvidenskab