Andre værktøjer – Københavns Universitet

CST > Online-værktøjer > Andre værktøjer

Andre værktøjer

Værktøjerne nedenfor kan ikke afprøves med egen tekst. De optræder enten som demoer eller blot forklaret med tekst

Hvordan fjerner man følsomme data fra en tekst? 

Med et anonymiseringsværktøj, en variant af navnegenkenderen, kan man erstatte person- og firmanavne, datoer, beløb m.m. i teksten med en neutral værdi.
Læs mere, og se en demo.

Egner din tekst sig til automatisk oversættelse med oversættelseshukommelse?

Automatisk oversættelse med oversættelseshukommelse er især velegnet til tekster der indholder en stor mængde gentagelser, eller som har en stor lighed med tidligere oversatte tekster. Måske er gentagelserne i virkeligheden termkandidater?  Med CST's gentagelsestjekker kan du se hvilke gentagelser der findes i dine tekster.
Læs mere og se eksempler på brug af gentagelsestjekkeren.

Hvordan forbedrer man søgemaskiner?

1. Søgemaskinen producerer for få relevante hits

Søgemaskinen bør kigge på kandidathits som måske ikke indeholder eksakt de samme ord som søgestrengen, men  ord som betyder det samme. Med en ontologi kan søgemaskinen konstruere nye søgestrenge som alternativer til det brugeren har indtastet og dermed finde flere hits.

2. Søgemaskinen producerer for mange - irrelevante - hits

Dette forekommer især når brugeren har indtastet flere ord, som hver for sig ikke er særlig selektive. Hvis maskinen er i stand til at genkende navneordsfraser, kan den begrænse søgeresultatet til de kandidathits hvor alle søgeord (fx affald og husholdning), nu opfattet som de betydningstunge ord i en alternativ udtryksform for et sammensat ord (fx affald fra husholdninger som alternativ for husholdningsaffald), forekommer i samme navneordsfrase. Forskningsresultater fra VID-projektet viser at sådanne hits typisk er de gode hits.

Bemærk i øvrigt at husholdning og husholdninger betragtes som 'det samme ord' i eksemplet. Søgemaskinen forventes naturligvis at have lemmatiseret både teksterne og brugerens søgestrenge!