Videnbaseret disambiguering – Københavns Universitet

CST > Projekter > Videnbaseret disambigu...

Vidensbaseret leksikalsk disambiguering

Støttet af Forskningsrådet for Kultur og Kommunikation

Den flertydighed, der findes i sprog, er et af de største problemer for datamatisk natursprogsbehandling. Det skyldes, at opløsningen af en flertydighed kan afhænge af en `dyb forståelse' af teksten. `Dyb forståelse' modelleres almindeligvis ved, at teksten konverteres til en logisk repræsentation, som kan interpreteres og viderebehandles af maskiner. For at bestemme den korrekte læsning af et flertydigt ord automatisk i kontekst skal man identificere beregningsprocesser, som på adækvat vis modellerer leksikalisk disambiguering på baggrund af de logiske repræsentationer.

I overensstemmelse med kommunikationskonventionen at interpretere tekst så konsistent som muligt, bruger logik-baserede tilgange en klassisk logik til at forkaste læsninger der i den givne kontekst fører til en kontradiktion med vores begrebsviden. Problematisk er dog, at inferensskemaet, som er anvendt, generelt set ikke er afgørligt og derfor ikke kan løses af computere.

Heldigvis er der evidens for, at en adækvat modellering netop forudsætter en ufuldstændig logik, da det ikke er al den information, der kan udledes fra en tekst, som er relevant for disambiguering. Ud fra yderligere undersøgelser af disambiguerende slutninger vil vi udvikle en begrænset logik (ufuldstændig og afgørlig), som tillader at modellere menneskelig disambiguering på en måde, der er både empirisk adækvat og effektiv. Eftersom begrebsviden (betydningspostulater) automatisk kan ekstraheres fra ordbøger (Jerry Hobbs, personlig kommunikation), er udviklingen af en sådan logik særlig relevant.

Kontakt: Jürgen Wedekind