MCL - Multifunctional Computational Lexicon of Contemporary Portuguese

View resource name in all available languages

MCL- Lexique informatique multifonctionnel du portugais contemporain

ID:

ELRA-L0096

MCL is a 26,443 lemma Frequency Lexicon with 140,315 tokens, with the minimum lemma frequency of 6, extracted from CORLEX, a contemporary Portuguese corpus (16,210,438 words). CORLEX is a subcorpus of the Reference Corpus of Contemporary Portuguese and contains written and spoken texts of several types, being genre diversity a characteristic of this corpus. CORLEX contains mainly journalistic texts (56% of the written corpus and 53% of the whole corpus). In order to extract the lexicon, all the different lexical forms occurring in the corpus were indexed and subsequently tagged morphosyntactically and lemmatised by PALAVROSO.

Each lemma in MCL is followed by morphosyntactic and quantitative information. The same information is given regarding each lemma token (inflected forms and some compounds). The lexicon indexations are listed in alphabetical order or decreasing frequency order.

View resource description in all available languages

MCL est un lexique de fréquences de lemmes qui contient 140,315 mots, avec une fréquence minimale d’apparition égale à 6. Le lexique a été extrait de CORLEX, un corpus du portugais contemporain (16,210,438 mots). CORLEX est un sous-corpus du Corpus de Référence du Portugais Contemporain, lequel comprend plusieurs types de textes. CORLEX comprend principalement des textes journalistiques (56% du corpus écrit et 53% du corpus total). Afin d'extraire le lexique, toutes les formes lexicales dans le corpus ont été indexées et ensuite étiquetées et lemmatisées avec PALAVROSO.

Chaque lemme dans MCL est suivi d'informations morphosyntaxiques et quantitatives. Ces informations sont aussi fournies pour les formes fléchies et pour certains mots composés. Les indexations du lexique sont listées alphabétiquement ou par ordre décroissant des fréquences.

You don’t have the permission to edit this resource.