New Oxford Dictionary of English, 2nd Edition

View resource name in all available languages

NODE (New Oxford Dictionary of English - nouveau dictionnaire d'anglais Oxford), 2e édition

NODE

ID:

ELRA-L0045

This is Oxford University Press's most comprehensive single-volume dictionary, with 170,000 entries covering all varieties of English worldwide. The NODE data set constitutes a fully integrated range of formal data types suitable for language engineering and NLP applications: It is available in XML or SGML.
- Source dictionary data. The NODE data set includes all the information present in the New Oxford Dictionary of English itself, such as definition text, example sentences, grammatical indicators, and encyclopaedic material.
- Morphological data. Each NODE lemma (both headwords and subentries) has a full listing of all possible syntactic forms (e.g. plurals for nouns, inflections for verbs, comparatives and superlatives for adjectives), tagged to show their syntactic relationships. Each form has an IPA pronunciation. Full morphological data is also given for spelling variants (e.g. typical American variants), and a system of links enables straightforward correlation of variant forms to standard forms. The data set thus provides robust support for all look-up routines, and is equally viable for applications dealing with American and British English.
- Phrases and idioms. The NODE data set provides a rich and flexible codification of over 10,000 phrasal verbs and other multi-word phrases. It features comprehensive lexical resources enabling applications to identify a phrase not only in the form listed in the dictionary but also in a range of real-world variations, including alternative wording, variable syntactic patterns, inflected verbs, optional determiners, etc.
- Subject classification. Using a categorization scheme of 200 key domains, over 80,000 words and senses have been associated with particular subject areas, from aeronautics to zoology. As well as facilitating the extraction of subject-specific sub-lexicons, this also provides an extensive resource for document categorization and information retrieval.
- Semantic relationships. The relationships between every noun and noun sense in the dictionary are being codified using an extensive semantic taxonomy on the model of the Princeton WordNet project. (Mapping to WordNet 1.7 is supported.) This structure allows elements of the basic lexical database to function as a formal knowledge database, enabling functionality such as sense disambiguation and logical inference.
- Derived from the detailed and authoritative corpus-based research of Oxford University Press's lexicographic team, the NODE data set is a powerful asset for any task dealing with real-world contemporary English usage. By integrating a number of different data types into a single structure, it creates a coherent resource which can be queried along numerous axes, allowing open-ended exploitation by many kinds of language-related applications.

View resource description in all available languages

Cet ouvrage est le dictionnaire en un volume le plus complet qui soit publié par les Presses Universitaires d'Oxford. Il présente 170 000 entrées, qui couvrent toutes les variétés de la langue anglaise de par le monde. Les données contenues dans le NODE (New Oxford Dictionary of English) sont formatées de façon à pouvoir être exploitées dans les technologies de la langue et pour des applications de TAL. Ce dictionnaire est disponible aux formats XML et SGML.

- Données sources : l'ensemble des données NODE comprend toutes les informations disponibles dans l'ouvrage Nouveau dictionnaire anglais Oxford, telles que des définitions, des exemples, des indicateurs grammaticaux et des éléments d'information encyclopédique.

- Données morphologiques : chaque lemme dans NODE (les entrées principales et secondaires) est accompagné d'une liste complète de toutes les formes syntaxiques possibles (les noms avec leur forme au pluriel, les verbes avec leurs flexions, les adjectifs avec leurs comparatifs et superlatifs), balisées de telle sorte que les relations syntaxiques entre elles sont précisées. Chaque forme est donnée avec sa transcription phonétique IPA. Les informations morphologiques sont également données pour les variantes orthographiques (en particulier pour l'anglais américain), et un réseau de liens permet de basculer directement de la forme variante à la forme standard. Ces données constituent ainsi un élément fiable pour les programmes de recherche et peut s'avérer aussi très utile pour les applications utilisant des termes d'anglais britannique et d'anglais américain.

- Expressions et idiomes : plus de 10 000 expressions verbales et autres expressions composées sont marquées dans les données NODE. On y trouve des ressources lexicales permettant à des applications d'identifier une expression non seulement parmi les entrées listées dans le dictionnaire mais également parmi les variations courantes du quotidien, telles que les différentes prononciations, les modèles syntaxiques variables, les verbes conjugués, les déterminants optionnels, etc.

- Classification par domaine : plus de 80 000 mots et sens de mots ont été associés à leur domaine d'application. Plus de 200 domaines d'application sont en effet disponibles, de l'aéronautique à la zoologie. Cela facilite l'extraction de lexiques spécialisés par domaine, et représente une ressource considérable pour la catégorisation de documents et la recherche d'information.

- Relations sémantiques : les relations entre chacun des noms et leurs différents sens ont été codées suivant une taxonomie sémantique élaborée sur le modèle du projet WordNet de Princeton (compatible avec WordNet 1.7). Cette structure permet aux éléments de la base de données lexicale de fonctionner comme une base de connaissance formelle, autorisant ainsi des fonctionnalités telles que la désambiguïsation du sens des mots et les relations d'inférence.

- Elaboré par l'équipe de lexicographie des Presses Universitaires d'Oxford, NODE représente un composant indispensable pour toutes tâches et applications basées sur la langue anglaise contemporaine et son usage. NODE, en rassemblant différents types de données dans une même structure, est une ressource cohérente et homogène, qui peut s'avérer utile et exploitable dans le cadre de différentes tâches et applications pour les technologies de la langue.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following: