Ansatte – Københavns Universitet

CST > Ansatte

Sussi Olsen

Sussi Olsen

Videnskabelig medarbejder

Sprogkundskaber

Dansk, engelsk, spansk

Cand.mag. i spansk (hovedfag) og datalingvistik fra Københavns Universitet.

Siden maj 1997 ansat som videnskabelig medarbejder på Center for Sprogteknologi (NorS) på Københavns Universitet.

 Opgaver og projekter

2018 -> Deltager i EU-projektet ELEXIS om samarbejde og informationsudveksling i leksikografiske miljøer i Europa og om at gøre leksikografiske data tilgængelige for sprogteknologi.

2017 -> Deltager i EU-projektet eTranslation TermBank om indsamling af terminologi til EU's oversættelsesplatform.

2017 -> Deltager i EU-projektet ELRC der indsamler sproglige data fra offentlige myndigheder til brug i EU's oversættelsesplatform for offentlige institutioner.

2016 -17 Deltager i EU-projektet CLARIN+ med opgave i at finde nye CLARIN-medlemmer blandt EU-lande og associerede lande.

2016-2017 Deltager i et projekt med Det Danske Sprog- og Litteraturselskab finansieret af Carlsbergfondet om at udvikle en lemmatiser og pos-tagger for ældre dansk

2015-17 Deltager i EU-projektet Language Technology Observatory, beskæftiget med at finde og udvælge sprogresurser til brug for maskinoversættelse.

2013-17 Deltager i FKK-projektet Semantic Processing across domains, især involveret i semantisk opmærkning af korpora.

Deltager i DigHumLab-projektet med forskelligartede opgaver

2013-2016 Deltager i det nordiske netværk LUNAS som beskæftiger sig med akademisk sprogbrug

2011-2013 Deltager i EU-projektet META-NORD især involveret i opdatering af STO-ordbasen til LMF-format. 

2010 –> Underviser på ph.d.-kursus i korpuslingvistik især om LSP korpora og metadata                                               

2010-2012 Med i EU-projektet LetsMT!. Hovedsagelig beskæftiget med dataindsamling men også med fastlæggelse af emneområder, teksttyper og andre metadata.

2008 - 2011 Leder af arbejdspakke 2.2 i det danske Clarin-projekt DK-CLARIN. Formålet for denne var indsamling af fagsproglige subkorpora på i alt 11 mio. ord fordelt på tre-fem domæner samt opmærkning af teksterne med morfologisk information og termstatus. 

2007 - 2009 Deltager i FKK-projektet DAD om opmærkning af både skrevne og talte korpora med abstrakte anaforer og disses referencer.

1997-2005

2005 - Validator samt instruktør og supervisor for andre validatorer på forskellige internationale ordbogs- og korpusprojekter, bl.a.  EuroWordnet for ELRA, LC-STAR II samt to nationale hollandske korpora. Supervisor for studentermedhjælpere i et projekt om bilingual alignering af parallelle korpora. 

2007 - Beskæftiget med opdatering af STO, den sprogteknologiske ordbase, og afholdelse af kurser om denne.

2005-2007 Beskæftiget i EU-projektet Eurotermbank om opbyggelsen af en termbank for de nye EU-medlemslande.
Beskæftiget i et projekt om et program til automatisk kommatering.

2003 Beskæftiget i et projektsamarbejde med Systran hvor formålet var at levere morfologiske data til et maskinoversættelsesprojekt (da-en). 

1999-2000 Beskæftiget i EU-projektet SIMPLE hvis formål var at udvikle semantiske sprogteknologiske ordbøger.

1998 Beskæftiget i et projekt for Arbejdsskadestyrelsen hvor CST's opgave bestod i at analysere og kortlægge deres dokumentproduktion med henblik på en forenkling af denne.

1998-2006 Beskæftiget i projektet STO, den sprogteknologiske ordbase for dansk, involveret i næsten alle aspekter af ordbaseudviklingen, både lingvistiske og tekniske. Hovedopgaver udover selve ordbogsskrivningen var fastlægning af principperne for verbers og adjektivers morfologi, samt principperne for substantivernes syntaks. Derudover administrator af ordbasens tekstkorpusser

Netværk og tillidsposter

Medlem af formidlingsudvalget på Nordisk Forskningsinstitut, KU

Formand for LEDA, Foreningen af Leksikografer i Danmark

Uddannelse

cand. mag.

ID: 1498977