10. juni 2024
COR.SEM - semantisk information i COR-registret
Det Centrale Ordregister (COR) er blevet udvidet med en ny ressource, COR.SEM, som tilføjer semantisk information til en stor del af ordene i COR-registeret. COR.SEM er udviklet i et samarbejde mellem Det Danske Sprog- og Litteraturselskab og CST og indeholder betydningsbeskrivelser af 34.000 lemmaer fra Retskrivningsordbogen og DDO. Betydningsbeskrivelserne er baseret på det danske WordNet DanNet, Det Danske FrameNetleksikon og Det Danske Sentiment-leksikon. COR.SEM kan anvendes til diverse sprogteknologiske formål, fx betydningsopmærkning af tekst og test og træning af sprogmodeller.
Man kan få mere at vide om ressourcen på corsem.dsl.dk, hvor man kan foretage forskellige søgninger og downloade dele af datasættet.