Centralt OrdRegister for dansk
Centralt OrdRegister for dansk (COR) er et samarbejdsprojekt mellem Det Danske Sprog- og Litteraturselskab, Dansk Sprognævn, CST og Digitaliseringsstyrelsen om at udvikle en fælles dansk sprogressource til AI-formål. Formålet med projektet er dels at støtte en effektiv deling af danske sprogressourcer, dels at stille et betydningsinventar for danske ord (lemmaer) til rådighed for virksomheder og forskere der arbejder med AI. COR indarbejder og opgraderer bl.a. ressourcer der tidligere er udviklet ved CST og DSL såsom det danske wordnet DanNet, Dansk FrameNet og Dansk Sentimentleksikon.
Den semantiske del af det centrale ordregister - COR.SEM - er nu klar. Den kan tilgås fra ordregister.dk ligesom de øvrige COR-ressourcer eller fra corsem.dsl.dk, hvorfra man har mulighed for at udføre mange forskellige søgninger i ressourcen samt downloade hele eller dele af den.
Partnere i projektet
- Digitaliseringsstyrelsen
- Dansk Sprognævn
- Det Danske Sprog- og Litteraturselskab
- Københavns Universitet, NorS, Center for Sprogteknologi
Projektet ledes af de fire partnere i fællesskab.
Publikationer
Diderichsen, C., Henrichsen, P. J., Widmann, T. (2022) Det Centrale Ordregister. I Nyt Fra Sprognævnet. Oktober 2022. ISSN 2446-3124.
Henrichsen, P. J. (2024). Det Centrale Ordregister: et indeks for det danske ordforråd – en gave til dansk sprogteknologi. I Nordiske Studier i Leksikografi 16 (Den 16:e konferensen om lexikografi i Norden), Lund Universitet.
Henrichsen, P. J. (2023) Diktaroriske Befølelser: Om ord og uord i Det Centrale Ordregister. I Proceedings of MUDS19 (19. Møde om Udforskningen af Dansk Sprog). Aarhus Universitet.
Pedersen, B. S., Nimb, S., Sørensen, N. C. H., Olsen, S., Flörke, I., & Troelsgaard, T. (2023). Reusing the Danish WordNet for a New Central Word Register for Danish. I Proceedings of Global WordNet Conference 2023, Association for Computational Linguistics (ACL).
Nimb, S., Pedersen, B. S., Sørensen, N. C. H., Flörke, I., Olsen, S., & Troelsgaard, T. (2022). COR-S – den semantiske del af Det Centrale OrdRegister (COR). LexicoNordica, 29, 75-97. https://tidsskrift.dk/lexn/article/view/134776
Pedersen, B. S., Sørensen, N. C. H., Nimb, S., Flørke, I., Olsen, S., & Troelsgård, T. (2022). Compiling a Suitable Level of Sense Granularity in a Lexicon for AI Purposes: The Open Source COR-Lexicon. I Proceedings of the 13th Language Resources and Evaluation Conference, Marseille, France (s. 51-60). European Language Resources. Association. https://doi.org/http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.6.pdf
Pedersen, B. S., Nimb, S., & Olsen, S. (2022). Leksikalsk-semantiske sprogressourcer: Hvad kan de, og hvordan udvikler vi dem bedst? I LIVE and LEARN: Festschrift in honor of Lars Borin (s. 115-121). GU-ISS: Gøteborg Universitetsforlag. https://gupea.ub.gu.se/handle/2077/74254
Widmann, T. (2023) Det Centrale Ordregister (COR): Hvad, hvor, hvorfor og hvordan? I Rapport fra MUDS19 (19. Møde om Udforskningen af Dansk Sprog). Aarhus Universitet.
Widmann, T. (2024) "Det Centrale Ordregister og dets leksikografiske anvendelser". I Nordiske Studier i Leksikografi 16 (Den 16:e konferensen om lexikografi i Norden), Lund Universitet.
Presse
Lotte Thorsen: Nu bliver alle danske ord udstyret med et nummer, Politiken 5. januar 2023.
https://politiken.dk/kultur/art9148822/Nu-bliver-alle-danske-ord-udstyret-med-et-nummer
Deltagere fra Københavns Universitet
Navn | Titel | Telefon | |
---|---|---|---|
Bolette Sandford Pedersen | Professor, Viceinstitutleder | +4535329078 | |
Simon Gray | Forskningsfuldmægtig | +4535337688 | |
Sussi Olsen | Akademisk medarbejder FU | +4535329064 |
Støttet af
Projektet er bevilget af Projektet er bevilget af fællesoffentlige midler via Digitaliseringsstyrelsen.
Projektbeløb: 5.189.970 kr. i alt.
Projektperiode: marts 2021 til december 2023.
Kontakt
KU-projektleder
Bolette Sandford Pedersen
Professor, viceinstitutleder
Institut for Nordiske Studier og Sprogvidenskab