DanNet
DanNet er et WordNet, dvs. en lexico-semantisk netværksgraf, der viser hvordan betydninger i sproget relaterer til andre gennem navngivne forbindelser. Man kan også tænke på et WordNet som en slags maskinlæsbar ordbog.
På wordnet.dk/dannet kan du både browse DanNet samt downloade de nyeste versioner af flere forskellige datasæt.
Til forskel fra en almindelig ordbog er det ikke definitionen af ordet, der står i centrum i et WordNet, men i højere grad ordets relationer til andre ord. I DanNet kan man f.eks. se at en dværgpil er en slags busk, at et lysthus findes i en have, at fiberdrys bruges til at spise, og at kager typisk fremstilles ved bagning og typisk er lavet af mel og sukker.
På andreord.nors.ku.dk kan du generere ovenstående illustration på baggrund af en ældre version af DanNet. I fremtiden vil lignende illustrationer baseret på det nyeste data kunne findes på det nye DanNet.
I alt er der pt. registreret cirka 70 tusinde begreber, som holdes på plads af omtrent 500 tusinde indbyrdes relationer.
Tilblivelsen af DanNet og metoderne bag beskrives bedst i denne artikel:
Pedersen, Bolette S. Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen (2009). DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionary (pdf). Lang Resources & Evaluation 43:269–299.
For enklere, dansksprogede tilgange til wordnettet henvises til:
- Bolette S. Pedersen, Sanni Nimb 2009. Et net af ord. K. Farø, A. Holsting, N.Larsen, J.E. Mogensen & T. Vinther (eds). Sprogvidenskab i glimt. 70 tekster om sprog i teori og praksis (pdf). Syddansk Universitetsforlag, s.112-117.
- Sanni Nimb og Nicolai H. Sørensen: Et leksikalsk-semantisk wordnet for dansk (pdf). (2006). 11. Møde om Udforskning af Dansk Sprog, Århus MUDS 2006.
DanNet har gennem tiden været støttet af Det Danske Forskningsråd (DFF), Forskningsministeriet og EU. Den oprindelige version blev udviklet for midler bevilget af Det Danske Forskningsråd i projektet DanNet – et leksikalsk-semantisk ordnet for dansk, og senere er ressourcen blevet videreudviklet i forbindelse med nyere forskningsprojekter, fx CLARIN-DK, METANORD, Semantic Processing across Domains og ELEXIS.
Wordnettet er udviklet semi-automatisk som en del af de ovenfor nævnte forskningsprojekter og for relativt små midler. Vi tager derfor forbehold for eventuelle fejl og mangler. Observerede fejl og mangler kan rapporteres til bspedersen@hum.ku.dk.
En del af ordforrådet er linket til engelsk, svensk, finsk og estisk: WordTies: A Nordic/Baltic Multilingual Wordnet Initiative. Det er planen på længere sigt at linke hele DanNet til den tilsvarende engelske ressource, Princeton WordNet for på den måde at kunne anvende ressourcen i flersproglige sammenhænge.
Som hjælp til oversættelsen af 5000 såkaldte Base Concepts til dansk er oversættelseslisterne fra Dansk parlør venligt stillet til rådighed af Den Danske Online Ordbog og Orcapia v/ Per Bang.
Du kan downloade DanNet-ressourcen i to forskellige formater. Ved at downloade af et datasæt accepterer du CC BY-SA 4.0-licensen:
- RDF-datasæt (den primære ressource)
- Én enkelt TTL-fil der nu udgør hovedressourcen.
- CSV-datasæt (et alternativt format)
- Denne ZIP-fil indeholder en række CSV-filer samt CSVW-metadata, der tilsammen kan bruges til genskabe det meste af indholdet i RDF-ressourcen.
Der findes flere RDF-datasæt, som også kan downloades på wordnet.dk/dannet. Disse andre datasæt kan bruges til at udvide RDF-hovedressourcen med andet nyttigt data.
Ved reference til ressourcen bedes anvendt denne artikel: Bolette S. Pedersen, Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen. DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionary (pdf). Lang Resources & Evaluation (2009) 43:269–299.
Hent lingvistiske specifikationer
Bemærk at disse specifikationer er baseret på en ældre udgave af DanNet; dog bør de stadig kunne bruges til at forstå indholdet i DanNet-ressourcen. Det eneste du skal være opmærksom på, er at visse navne på relationer/attributter kan have ændret sig.
- Hovedpublikation: Pedersen, Bolette S. Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen og Henrik Lorentzen (2009). DanNet – the challenge of compiling a WordNet for Danish by reusing a monolingual dictionary. Lang Resources & Evaluation 43:269–299.
- Pedersen, Bolette S.; Aguirrezabal Zabaleta, Manex; Nimb, Sanni; Olsen, Sussi; Rørmann, Ida. (2018) Towards a principled approach to sense clustering – a case study of wordnet and dictionary senses in Danish. Proceedings of Global WordNet Conference 2018. Singapore, 2018.
- Pedersen, Bolette Sandford; Nimb, Sanni; Olsen, Sussi; Sørensen, Nicolai Hartvig. (2018). Combining Dictionaries, Wordnets and other Lexical Resources - Advantages and Challenges. Globalex Proceedings 2018, Miyasaki, Japan. 2018.
- Sanni Nimb, Bolette S. Pedersen, Anna Braasch, Nicolai H. Sørensen & Thomas Troelsgård (2013) Enriching a wordnet from a thesaurus. Workshop Proceedings on Lexical Semantic Resources for NLP from the 19th Nordic Conference on Computational Linguistics (NODALIDA). Linköping Electronic Conference Proceedings; Volume 85 (ISSN 1650-3740).
- Sanni Nimb, Bolette Sandford Pedersen (2012).Towards a richer wordnet representation of properties – exploiting semantic and thematic information from thesauri. LREC 2012 Proceedings. Istanbul, Turkey
- Bolette S. Pedersen, Sanni Nimb, Anna Braasch (2010). Merging specialist taxonomies and folk taxonomies in wordnets – a case study of plants, animals and foods in the Danish wordnet. Proceedings from 7th Conference on Language Resources and Evaluation, LREC. Malta
- Henrik Lorentzen, Sanni Nimb (2010). Fra ordbog til wordnet. Hvordan udmøntes en ordbogsdefinition i en formaliseret wordnetbeskrivelse?. Harry Lönnroth & Kristina Nikula (red.) (2010): Nordiska studiar i lexikografi 10. Rapport från Konferencen om lexikografi i Norden, Tammerfors 3-5 juni 2009, pp. 329-344. Tammerfors
- Sanni Nimb, Lars Trap-Jensen (2009). Use, Re-use and Synergetic Benefit: The Interplay between WordNet and Dictionary Data« . I: GSCL Forum – Special Issue on Lexical-Semantic and Ontological Resources. German Society for Computational Linguistics. 19. s.
- Bolette S. Pedersen, Sanni Nimb (2009). Et net af ord. K. Farø, A. Holsting, N.Larsen, J.E. Mogensen & T.Vinther (eds). Sprogvidenskab i glimt. 70 tekster om sprog i teori og praksis. Syddansk Universitetsforlag, s.112-117.
- Pedersen, B.S. & A. Braasch (2009). What do we need to know about humans? A view into the DanNet Database. In: K. Jokinen and E. Bick (eds.) Proceedings of the 17th Nordic Conference of Computational Linguistics NODALIDA 2009. NEALT Proceedings Series, Vol. 4, Odense, Denmark.
- Sanni Nimb (2009). The Semantic Relations of Artifacts in DanNet. In B.S. Pedersen, A.Braasch, S.Nimb, R. Vatvedt Fjeld (eds.): Proceedings of the NODALIDA 2009 workshop "WordNets and other Lexical Semantic Resources - between Lexical Semantics, Lexicography, Terminology and Formal Ontologies" NEALT Proceedings Series, Vol. 7 Published by Northern European Association for Language Technology (NEALT), Electronically published at Tartu University Library (Estonia)
- Pedersen, B.S., A. Braasch, S. Nimb, R. V. Fjeld (eds) (2009). WordNets and other Lexical Semantic Resources - between Lexical Semantics, Lexicography, Terminology and Formal Ontologies. In: Proceedings of the NodaLida 2009 Workshop, NEALT Proceedings Series, Vol. 7, Odense, Denmark. (elektronisk publicering, derfor ingen sidetal).
- Sanni Nimb & Lars Trap-Jensen (2008): Use, Re-use and Synergetic Benefit: The Interplay between WordNet and Dictionary Data. In: GSCL Forum – Special Issue on Lexical-Semantic and Ontological Resources. German Society for Computational Linguistics.
- Pedersen, B.S., S. Nimb & L. Trap-Jensen. (2008). DanNet: udvikling og anvendelse af det danske wordnet. In: Nordiske Studier i leksikografi Vol. 9, Skrifter udgivet af Nordisk Forening for Leksikografi, pp. 353-370
- Pedersen, B.S. & A. Braasch, L. Henriksen, S. Olsen and C. Povlsen (2008). Merging a Syntactic Resource with a WordNet: a Feasibility Study of a Merge between STO and DanNet. In: Proceedings from the sixth International Conference on Language Resources and Evaluation 2008. Marrakech, Marokko, pp. 1-5.
- Pedersen, B.S., S. Nimb, L. Trap-Jensen (2008): DanNet: udvikling og anvendelse af det danske wordnet. In: Ásta Svavarsdóttir, Guðrún Kvaran, Gunnlaugur Ingólfsson, Jón Hilmar Jónsson (eds): Nordiske Studier i Leksikografi 9, NFL-skrift nr. 10, Reykjavík 2008, s. 351-367
- Pedersen, B.S. & S. Nimb. (2008). Event Hierarchies in DanNet. In: A. Tanács, D. Csendes, V. Vincze, C. Fellbaum, & P. Vossen (eds) Proceedings of Global WordNet Conference, Szeged, Hungary 22-25, pp. 339-349.
- Nimb, Sanni & Nicolai Sørensen (2007): DanNet — et leksikalsk-semantisk WordNet for dansk. In: Peter Widell & Ulf Davad Berthelsen (eds.): 11. Møde om Udforskningen af Dansk Sprog. Århus, Danmark, s. 191-2000.
- Pedersen, B.S., P. Paggio & C. Navarretta. (2007). Sprogteknologiske ressourcer til informationss�gning, in: M. L. Nielsen (ed.) Dansk Biblioteksforskning - Tidsskrift for informations- og kulturformidling 3 (2), p. 5-18.
- Asmussen, J. Pedersen, B.S. & Trap-Jensen, L. (2007). DanNet: From Dictionary to WordNet. Kunze, C., Lemnitzer, L. & Osswald, R. (eds.) GLDV-2007 Workshop on Lexical-Semantic and Ontological Resources 1-11. Universität Tübingen, Tyskland.
- Pedersen, Bolette S. & Nicolai Sørensen (2006): Towards sounder taxonomies in Wordnets. In: Alessandro Oltramari, Chu-Ren Huang, Alessandro Lenci, Paul Buitelaar, Christiane Fellbaum (eds.): Ontolex 2006, pp. 9-16. Genova, Italy.
- Pedersen, B.S., S. Nimb, N., J. Asmussen, N. Sørensen, L. Trap-Jensen, H. Lorentzen (2006). DanNet - A WordNet for Danish. In: Proceedings from Third International Conference on Global Wordnets, pp. 329-331. Jeju, South Corea.
- Paggio, P. & B.S. Pedersen (2006). Bedre adgang til viden - Informationssøgning med ontologi og sprogteknologi. In: A. Braasch, C. Navarretta, S. Nimb, S. Olsen, P. Paggio, B.S. Pedersen & J. Wedekind (eds.) Sprogteknologi i et dansk perspektiv - En samling artikler om sprogforskning og automatisk sprogbehandling pp. 329-354. Reitzels Forlag, København.
- Pedersen, B.S., & J. Asmussen (2006). DanNet - Fra ordbog til et leksikalsk-semantisk WordNet for dansk I: Leda-Nyt pp. 3-12.København.
- Asmussen, Jørg (2006): Korpuslinguistische Verfahren zur Optimierung lexikalisch-semantischer Beschreibungen. In: Jahrbuch des Instituts für Deutsche Sprache 2006. Mannheim, Germany.
Professor Bolette S. Pedersen
Center for Sprogteknologi
Institut for Nordiske Studier og Sprogvidenskab
bspedersen@hum.ku.dk
Seniorredaktør Sanni Nimb
Det Danske Sprog- og Litteraturselskab
sn@dsl.dk
Støttet af
Carlsberg Fondets infrastrukturpulje støtter i perioden 2018-2022 en opgradering af DanNet, der går ud på at få ressourcen udvidet og opdateret på basis af Den Danske Begrebsord samt linket til engelsk.
Arbejdet foregår i et samarbejde mellem Det Danske Sprog- og Litteraturselskab og KU.
Partnere
DanNet er udviklet på basis af Den Danske Ordbog i et samarbejde mellem Center for Sprogteknologi, Københavns Universitet og Det Danske Sprog- og Litteraturselskab.