Det abstrakte det: en empirisk analyse og formalisering

Støttet af Forskningsrådet for Kultur og Kommunikation

Projektets overordnede mål

Projektets overordnede mål var at udvikle en formel model over brugen af abstrakte pronominelle anaforer på dansk.

Hvad er abstrakte pronominelle anaforer?

Projektet beskæftigede sig med pronominerne det, dette og det her når de sproglige udtryk som de peger tilbage i diskursen (såkaldte antecedenter) er prædikater i kopulakonstruktioner, verbale udtryk, sætninger, diskurssegmenter eller abstrakte pronominer. Disse pronominer refererer til abstrakte entiteter i diskursen, og derfor kaldes abstrakte. Et eksempel på abstrakt anafor er følgende:

og så prøvede jeg så at gå lidt i svømmehallen og det prøver jeg sådan ind imellem [Samtale med Lægen (Duncker & Hermann, 1996)]

I eksemplet peger pronominet det tilbage på verbalsyntagmet at gå lidt i svømmehallen (antecedenten), og refererer til en abstrakt entitet, handlingen: at gå i svømmehallen.

Hvorfor er de danske abstrakte anaforer interessante?

Abstrakte anaforer, og især det abstrakte det, er meget frekvente i skriftsprog og endnu mere i talesprog (Navarretta 2002). De refererer til de centrale begreber i diskurs. Det er derfor vigtigt at definere en formel model til at identificere de entiteter de henviser og refererer til. At opstille sådan en model er vigtigt for systemer der skal uddrage viden fra tekster og talesprog, for maskinoversættelse, samt for opbygning af natursprogsbaserede grænseflader. At afklare hvordan mennesker bruger det, og hvordan dets mangeartede antecedenter og referenter bliver identificeret, vil også give bedre indblik i de kognitive processer involveret i produktionen og behandlingen af diskurs, hvor morfologiske, syntaktiske, semantiske og pragmatiske faktorer interagerer. De danske abstrakte anaforer er også teoretisk interessante da de bruges i flere kontekster end fx de engelske og italienske.

Baggrunden for projektet

I projektet bygges på hovedansøgerens, Costanza Navarretta, phd-arbejde, The Use and Resolution of Intersentential Pronominal Anaphora in Danish Discourse. Dette arbejde indikerer at eksisterende teorier om abstrakte anaforer kun delvis beskriver de danske data, og at der er aspekter omkring brugen af de danske anaforer som ikke er undersøgt. Hovedformålet med projektet er at undersøge disse aspekter kontrastivt i forhold til engelsk og italiensk, samt udarbejde en formel model af abstrakt reference på dansk.

De grundlæggende teorier om anaforer som anvendes, baseres på kognitive modeller over refererende nominale udtryk. Disse modeller forudsætter at taleren laver nogle antagelser om modtagerens kognitive tilstand, og at disse antagelser afspejles i de refererende udtryk han anvender, se bl.a. (Givón 1983, Prince 1981; Ariel 1988; Gundel et al. 1993). Projektet tager også udgangspunkt i studier om abstrakte anaforer, især de engelske, bl.a. (Webber 1991; Fraurud 1992; Asher 1993; Gundel et al. 2005).

Opmærkning af abstrakte anaforer

Som en del af projektet opmærkes abstrakte anaforer (samt oplysninger om bl.a. deres antecedenter og referenter) i danske data (skrift- og talesprog) og i mindre omfang i italienske data.

Vi er ved at opmærket følgende typer tekster: EU-tekster, retskendelser, dele af det danske PAROLE-korpus og litterære tekster.

Vi er ved at opmærke monologer og dialoger fra DanPASS-korpusset og dialoger fra det italienske AVIP korpus.

Til opmærkning anvendes værktøjet PALinkA udviklet af Constantin Orasan, University of Wolverhampton.

Flere oplysninger om projektet kan findes på  www.cst.dk/dad/

Projektdeltagere og kontakt

Costanza Navarretta: costanza@hum.ku.dk

Sussi Olsen: saolsen @ hum.ku.dk