STO-ordbase – Københavns Universitet

Videresend til en ven Resize Print Bookmark and Share

CST > STO-ordbase

Sprogteknologisk orddatabase over det danske sprog

Den store danske SprogTeknologiske Ordbase, STO, indeholder ordbogsdata lagret i en database og er beregnet til maskinel anvendelse. Der er tale om den mest omfattende og detaljerede leksikalske datasamling på det danske marked, tilgængelig for både kommercielle og forskningsrelaterede formål.

Materialet er udarbejdet primært med sigte på sprogteknologiske anvendelser, men kan desuden udgøre en værdifuld basis for andre formål fx udarbejdelse af sprogundervisningsmateriale eller traditionelle leksikografiske projekter.

Læs mere om STO           Slå op i STO-basen  

STO-basen, både morfologi og syntaks, er blevet konverteret til Lexical Markup Language format. Konverteringen fandt sted som en del af META-NORD-projektet.  
Lexical Markup Language er et internationalt anerkendt XML format, og det er samtidig ISO-standarden for natursprogsprocessering af ordbøger. Læs mere på www.lexicalmarkupframework.org.

Læs mere om LMF-versionen for morfologi og syntaks, se hvilke ændringer der er foretaget i forhold til den oprindelige STO-base, og download nogle eksempler af STO-LMF-morfologi og -syntaks.

STO-morfologi i LMF        Eksempler på STO-morfologi

STO-syntaks i LMF           Eksempler på STO-syntaks