LabEx EFL

Fiche ressource

download Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceLefff (Lexique des formes fléchies du français)
DescriptionLe Lefff est un lexique morphologique et syntaxique à large couverture (Sagot 2010). Il est développé au sein de l'architecture Alexina (Architecture pour les LEXiques INformatiques et leur Acquisition), en parallèle à d'autres lexiques utilisant le même format. Cette architecture est à deux niveaux : - lexique intensionnel, qui décrit pour chaque entrée lexicale son lemme (forme canonique + table de flexion) et des informations de syntaxe profonde (cadre de sous-catégorisation en fonctions syntaxiques profondes et réalisations possibles + constructions/reformulations/diathèses admissibles) - lexique extensionnel, compilé automatiquement à partir du lexique intensionnel ; ce processus de génération comporte une phase de flexion, en fonction de la classe morphologique associée à l’entrée intensionnelle, puis une phase de construction de la structure syntaxique associée à chacune des formes fléchie obtenues (les informations syntaxiques variant d’une forme à une autre, en particulier pour les formes infinitives et participiales, et en fonction de chaque construction associée à l'entrée). Les informations lexicales présentes dans le Lefff sont issues de divers travaux : - acquisition automatique (avec validation manuelle) à l'aide de techniques statistiques appliquées sur des corpus bruts (Clément, Sagot et Lang 2004, Sagot 2005), - acquisition automatique (avec validation manuelle) d'informations syntaxiques atomiques (cf thèse de Sagot, 2006, ch 7) - correction et ajout manuel ou guidé par des techniques automatiques, comme par exemple la fouille d'erreurs dans les sorties d'analyseurs syntaxiques (Sagot et de La Clergerie, 2006), - comparaison avec d'autres ressources (Dicovalence, Tables du Lexique-Grammaire, Lexique des Verbes Français, TreeLex) : constructions impersonnelles, adverbes en -ment, quelques classes d'expressions verbales figées (Sagot et Danlos 2006, Danlos et Sagot 2007, Sagot et Danlos 2007, Sagot et Fort 2007, Sagot et Danlos soumis) ; par ailleurs, un certain nombre des noms et adjectifs viennent initialement du lexique morphologique Multext pour le français (Véronis 1998).
URLhttp://atoll.inria.fr/~sagot/lefff.html
Projet associéANR EDyLex (2010-2012), ANR Passage, Technolangue EASy, projet ILF LexSynt
Publication à citerSagot 2010
LicenceLGPL-LR
Droits d'accèsTéléchargement
ModalitéEcrit
Type de donnéesLexique
Provenance des donnéesExtraction semi-automatique, validation/correction manuelle, complétion manuelle
Formats de fichiersAlexina
Langue(s)French
Types d'informations linguistiquesMorphologie, syntaxe (valence, contrôle, montée, attributs, verbes supports, locutions figées…)
Codage des caractèresUTF-8
État d'avancementEn cours de développement

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

ALPAGE
StatutProducteur
Référent localBenoît Sagot
Adresse mailbenoit.sagot (at) inria.fr



Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin