Hjælp til værktøjer
CST har udviklet en lang række sprogteknologiske værktøjer og ressourcer, som vi synes andre også skal have glæde af. På denne side får du adgang til ressourcer og værktøjer, der kan analysere og opmærke dine egne ord og tekster og eksempler på, hvad disse værktøjer kan bruges til.
Gør din tekst klar til processering med sprogteknologiske værktøjer
Inden din tekst kan processeres med sprogteknologiske værktøjer, skal den renses for de visse elementer, såsom styretegn til layout, formateringskoder etc. Dette klares af vores tokeniser, der også sætter mellemrum mellem ord, tal og interpunktuationstegn. Prøv tokeniseren her.
Hvad er STO - den SprogTeknologiske Ordbase?
STO er en samling ordbogsdata beregnet til maskinel anvendelse i sprogteknologiske sammenhænge, med detaljeret information om ordenes bøjning, stavning og deres syntaktiske konstruktionsmuligheder (hvordan ordene bruges i sætninger). Slå op i STO
Hvilke ord består dine tekster af?
For at få en komplet liste over de ord der forekommer i en tekst, skal man først finde ordenes grundformer. Det klarer vores lemmatiser.
Hvilken ordklasse er de forskellige ord i teksten?
Indholdstunge ord i en tekst er ofte navneord - tænk blot på hvor hyppigt du søger efter navneord i en søgemaskine i forhold til fx udsagnsord. Med en POS-tagger (POS=Part Of Speech) kan man bestemme et ords ordklasse ud fra bl.a. ordets kontekst. Prøv CST's POS-tagger og få opmærket din tekst med ordklasser.
Hvilke navne optræder i din tekst?
Med en navnegenkender kan man lokalisere og opmærke person- og stednavne. Prøv navnegenkenderen.
Skal du lave grammatisk analyse af en tekst?
En fuld grammatisk analyse kan vi ikke klare online, men med vores NP-genkender, der genkender navneordsled, er du godt på vej. Læs mere, og prøv vores NP-genkender.
Kombiner værktøjerne
Værktøjerne kan arbejde sammen i forskellige kombinationer.Test en kombination af værktøjerne.
Har du brug for nemt at kunne finde relevant information i store tekstmængder?
I samarbejde med Kungliga Tekniska Høgskolan (KTH) har CST udviklet et resumeringsværktøj der kan lave automatisk resumering af tekster og dermed let uddrage den relevante information. Læs mere, og prøv resumeringsværktøjet.
CST har udviklet andre værktøjer end de her nævnte. Se demoer og omtale af værktøjer der ikke kan afprøves online.
Nyt værktøj?
CST kan måske hjælpe med at udvikle lige det værktøj eller modul, du mangler. Kontakt Bart Jongejan, bartj@hum.ku.dk, for at høre nærmere om mulighederne.