DanNet – Københavns Universitet

CST > Projekter > DanNet

DanNet

DanNet er et såkaldt wordnet, som primært er tænkt til maskinel anvendelse, fx i forbindelse med udvikling af sprogteknologiske tjenester. Wordnettet kan downloades, og man kan søge i det online via andreord.dk.

Til forskel fra en almindelig ordbog er det ikke definitionen af ordet, der står i centrum, men i højere grad ordets relationer til andre ord. I DanNet kan man fx se at en dværgpil er en slags busk, at et lysthus findes i en have,  at fiberdrys bruges til at spise, og at kager typisk  fremstilles ved bagning og typisk er lavet af mel og sukker.

I alt er der pt. registreret 66.308 begreber, som holdes på plads af 326.566 indbyrdes relationer. 

Mere om DanNet

Tilblivelsen af DanNet og metoderne bag beskrives bedst i denne artikel:

Pedersen, Bolette S. Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen (2009). DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionaryLang Resources & Evaluation 43:269–299.

For enklere, danskesprogede tilgange til wordnettet henvises til:

DanNet har gennem tiden været støttet af Det Danske Forskningsråd (DFF), Forskningsministeriet og EU. Den oprindelige version blev udviklet for midler bevilget af Det Danske Forskningsråd i projektet DanNet – et leksikalsk-semantisk ordnet for dansk, og senere er ressourcen blevet videreudviklet i forbindelse med nyere forskningsprojekter, fx CLARIN-DK, METANORD, Semantic Processing across Domains og ELEXIS.

Wordnettet er udviklet semi-automatisk som en del af de ovenfor nævnte forskningsprojekter og for relativt små midler. Vi tager derfor forbehold for eventuelle fejl og mangler. Observerede fejl og mangler kan rapporteres til bspedersen@hum.ku.dk.

En del af ordforrådet er linket til engelsk, svensk, finsk og estisk: WordTies: A Nordic/Baltic Multilingual Wordnet Initiative. Det er planen på længere sigt at linke hele DanNet til den tilsvarende engelske ressource, Princeton WordNet for på den måde at kunne anvende ressourcen i flersproglige sammenhænge.

Som hjælp til oversættelsen af 5000 såkaldte Base Concepts til dansk er oversættelseslisterne fra Dansk parlør venligt stillet til rådighed af Den Danske Online Ordbog og Orcapia v/ Per Bang.

Download DanNet-ressourcen

Du kan downloade DanNet-ressourcen og integrere den i en applikation under en open source-licens. Ved at downloade DanNet-ressourcen accepteres DanNet-licensen

Hent DanNet-specifikationer

Ved referencer til ressourcen bedes anvendt denne artikel: Bolette S. Pedersen, Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen. DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionaryLang Resources & Evaluation (2009) 43:269–299.

Publikationer

  • Hovedpublikation: Pedersen, Bolette S. Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen (2009). DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionaryLang Resources & Evaluation 43:269–299.
  • Pedersen, Bolette S.; Aguirrezabal Zabaleta, Manex; Nimb, Sanni; Olsen, Sussi; Rørmann, Ida. (2018) Towards a principled approach to sense clustering – a case study of wordnet and dictionary senses in Danish. Proceedings of Global WordNet Conference 2018. Singapore, 2018.
  • Pedersen, Bolette Sandford; Nimb, Sanni; Olsen, Sussi; Sørensen, Nicolai Hartvig. (2018). Combining Dictionaries, Wordnets and other Lexical Resources - Advantages and Challenges.  Globalex Proceedings 2018, Miyasaki, Japan. 2018.
  • Sanni Nimb, Bolette S. Pedersen, Anna Braasch, Nicolai H. Sørensen & Thomas Troelsgård (2013) Enriching a wordnet from a thesaurus. Workshop Proceedings on Lexical Semantic Resources for NLP from the 19th Nordic Conference on Computational Linguistics (NODALIDA). Linköping Electronic Conference Proceedings; Volume 85 (ISSN 1650-3740).
  • Sanni Nimb, Bolette Sandford Pedersen (2012).Towards a richer wordnet representation of properties – exploiting semantic and thematic information from thesauri. LREC 2012 Proceedings. Istanbul, Turkey
  • Bolette  S. Pedersen, Sanni Nimb, Anna Braasch (2010). Merging specialist taxonomies and folk taxonomies in wordnets – a case study of plants, animals and foods in the Danish wordnet. Proceedings from 7th Conference on Language Resources and Evaluation, LREC. Malta
  • Henrik Lorentzen, Sanni Nimb (2010). Fra ordbog til wordnet. Hvordan udmøntes en ordbogsdefinition i en formaliseret wordnetbeskrivelse?. Harry Lönnroth & Kristina Nikula (red.) (2010): Nordiska studiar i lexikografi 10. Rapport från Konferencen om lexikografi i Norden, Tammerfors 3-5 juni 2009, pp. 329-344. Tammerfors 
  • Sanni Nimb, Lars Trap-Jensen (2009). Use, Re-use and Synergetic Benefit: The Interplay between WordNet and Dictionary Data« . I: GSCL Forum – Special Issue on Lexical-Semantic and Ontological Resources. German Society for Computational Linguistics. 19. s.
  • Bolette S. Pedersen, Sanni Nimb (2009). Et net af ord. K. Farø, A. Holsting, N.Larsen, J.E. Mogensen & T.Vinther (eds). Sprogvidenskab i glimt. 70 tekster om sprog i teori og praksis. Syddansk Universitetsforlag, s.112-117. 
  • Pedersen, B.S. & A. Braasch (2009). What do we need to know about humans? A view into the DanNet Database. In: K. Jokinen and E. Bick (eds.) Proceedings of the 17th Nordic Conference of Computational Linguistics NODALIDA 2009. NEALT Proceedings Series, Vol. 4, Odense, Denmark.
  • Sanni Nimb (2009). The Semantic Relations of Artifacts in DanNet. In B.S. Pedersen, A.Braasch, S.Nimb, R. Vatvedt Fjeld (eds.): Proceedings of the NODALIDA 2009 workshop "WordNets and other Lexical Semantic Resources - between Lexical Semantics, Lexicography, Terminology and Formal Ontologies" NEALT Proceedings Series, Vol. 7 Published by Northern European Association for Language Technology (NEALT), Electronically published at Tartu University Library (Estonia)
  • Pedersen, B.S., A. Braasch, S. Nimb, R. V. Fjeld (eds) (2009). WordNets and other Lexical Semantic Resources - between Lexical Semantics, Lexicography, Terminology and Formal Ontologies. In: Proceedings of the NodaLida 2009 Workshop, NEALT Proceedings Series, Vol. 7, Odense, Denmark. (elektronisk publicering, derfor ingen sidetal).
  • Sanni Nimb & Lars Trap-Jensen (2008): Use, Re-use and Synergetic Benefit: The Interplay between WordNet and Dictionary Data. In: GSCL Forum – Special Issue on Lexical-Semantic and Ontological Resources. German Society for Computational Linguistics.
  • Pedersen, B.S., S. Nimb & L. Trap-Jensen. (2008). DanNet: udvikling og anvendelse af det danske wordnet. In: Nordiske Studier i leksikografi Vol. 9, Skrifter udgivet af Nordisk Forening for Leksikografi, pp. 353-370
  • Pedersen, B.S. & A. Braasch, L. Henriksen, S. Olsen and C. Povlsen (2008). Merging a Syntactic Resource with a WordNet: a Feasibility Study of a Merge between STO and DanNet. In: Proceedings from the sixth International Conference on Language Resources and Evaluation 2008. Marrakech, Marokko, pp. 1-5.
  • Pedersen, B.S., S. Nimb, L. Trap-Jensen (2008): DanNet: udvikling og anvendelse af det danske wordnet. In: Ásta Svavarsdóttir, Guðrún Kvaran, Gunnlaugur Ingólfsson, Jón Hilmar Jónsson (eds): Nordiske Studier i Leksikografi 9, NFL-skrift nr. 10, Reykjavík 2008, s. 351-367
  • Pedersen, B.S. & S. Nimb. (2008). Event Hierarchies in DanNet. In: A. Tanács, D. Csendes, V. Vincze, C. Fellbaum, & P. Vossen (eds) Proceedings of Global WordNet Conference, Szeged, Hungary 22-25, pp. 339-349.
  • Nimb, Sanni & Nicolai Sørensen (2007): DanNet — et leksikalsk-semantisk WordNet for dansk. In: Peter Widell & Ulf Davad Berthelsen (eds.): 11. Møde om Udforskningen af Dansk Sprog. Århus, Danmark, s. 191-2000.
  • Pedersen, B.S., P. Paggio & C. Navarretta. (2007). Sprogteknologiske ressourcer til informationss�gning, in: M. L. Nielsen (ed.) Dansk Biblioteksforskning - Tidsskrift for informations- og kulturformidling 3 (2), p. 5-18.
  • Asmussen, J. Pedersen, B.S. & Trap-Jensen, L. (2007). DanNet: From Dictionary to WordNet. Kunze, C., Lemnitzer, L. & Osswald, R. (eds.) GLDV-2007 Workshop on Lexical-Semantic and Ontological Resources 1-11. Universität Tübingen, Tyskland.
  • Pedersen, Bolette S. & Nicolai Sørensen (2006): Towards sounder taxonomies in Wordnets. In: Alessandro Oltramari, Chu-Ren Huang, Alessandro Lenci, Paul Buitelaar, Christiane Fellbaum (eds.): Ontolex 2006, pp. 9-16. Genova, Italy.
  • Pedersen, B.S., S. Nimb, N., J. Asmussen, N. Sørensen, L. Trap-Jensen, H. Lorentzen (2006). DanNet - A WordNet for Danish. In: Proceedings from Third International Conference on Global Wordnets, pp. 329-331. Jeju, South Corea. 
  • Paggio, P. & B.S. Pedersen (2006). Bedre adgang til viden - Informationssøgning med ontologi og sprogteknologi. In: A. Braasch, C. Navarretta, S. Nimb, S. Olsen, P. Paggio, B.S. Pedersen & J. Wedekind (eds.) Sprogteknologi i et dansk perspektiv - En samling artikler om sprogforskning og automatisk sprogbehandling pp. 329-354. Reitzels Forlag, København.
  • Pedersen, B.S., & J. Asmussen (2006). DanNet - Fra ordbog til et leksikalsk-semantisk WordNet for dansk I: Leda-Nyt pp. 3-12.København.
  • Asmussen, Jørg (2006): Korpuslinguistische Verfahren zur Optimierung lexikalisch-semantischer Beschreibungen. In: Jahrbuch des Instituts für Deutsche Sprache 2006. Mannheim, Germany.

Kontakt

Professor Bolette S. Pedersen
Center for Sprogteknologi
Institut for Nordiske Studier og Sprogvidenskab
bspedersen@hum.ku.dk 

Seniorredaktør Sanni Nimb
Det Danske Sprog- og Litteraturselskab 
sn@dsl.dk

Ekstra information / Sidebar

Partnere

DanNet er udviklet på basis af Den Danske Ordbog i et samarbejde mellem Center for Sprogteknologi, Københavns Universitet og Det Danske Sprog- og Litteraturselskab.