LabEx EFL


[Retour à la fiche]

Metadonnées au format OLAC

 
  <?xml version="1.0" encoding="UTF-8"?>
  <olac:olac
   xmlns:olac="http://www.language-archives.org/OLAC/1.1/" 
   xmlns:dc="http://purl.org/dc/elements/1.1/" 
   xmlns:dcterms="http://purl.org/dc/terms/" 
   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
   xsi:schemaLocation="http://www.language-archives.org/OLAC/1.1/ http://www.language-archives.org/OLAC/1.1/olac.xsd http://purl.org/dc/elements/1.1/
   http://dublincore.org/schemas/xmls/qdc/2006/01/06/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd">
  <dc:title>Lefff (Lexique des formes fléchies du français)</dc:title>
  <dc:publisher><dc:publisher>ALPAGE : Analyse linguistique profonde à grande échelle</dc:publisher>
  <dc:creator>Benoît Sagot</dc:creator>
  <dcterms:accessRights>Téléchargement</dcterms:accessRights>
  <dcterms:license>LGPL-LR</dcterms:license>
  <dcterms:provenance>Extraction semi-automatique, validation/correction manuelle, complétion manuelle</dcterms:provenance>
  <dc:language>French</dc:language>
  <dc:abstract>Le Lefff est un lexique morphologique et syntaxique à large couverture (Sagot 2010). Il est développé au sein de l'architecture Alexina (Architecture pour les LEXiques INformatiques et leur Acquisition), en parallèle à d'autres lexiques utilisant le même format. Cette architecture est à deux niveaux :
- lexique intensionnel, qui décrit pour chaque entrée lexicale son lemme (forme canonique + table de flexion) et des informations de syntaxe profonde (cadre de sous-catégorisation en fonctions syntaxiques profondes et réalisations possibles + constructions/reformulations/diathèses admissibles)
- lexique extensionnel, compilé automatiquement à partir du lexique intensionnel ; ce processus de génération comporte une phase de flexion, en fonction de la classe morphologique associée à l’entrée intensionnelle, puis une phase de construction de la structure syntaxique associée à chacune des formes fléchie obtenues (les informations syntaxiques variant d’une forme à une autre, en particulier pour les formes infinitives et participiales, et en fonction de chaque construction associée à l'entrée).

Les informations lexicales présentes dans le Lefff sont issues de divers travaux :
- acquisition automatique (avec validation manuelle) à l'aide de techniques statistiques appliquées sur des corpus bruts (Clément, Sagot et Lang 2004, Sagot 2005),
- acquisition automatique (avec validation manuelle) d'informations syntaxiques atomiques (cf thèse de Sagot, 2006, ch 7)
- correction et ajout manuel ou guidé par des techniques automatiques, comme par exemple la fouille d'erreurs dans les sorties d'analyseurs syntaxiques (Sagot et de La Clergerie, 2006),
- comparaison avec d'autres ressources (Dicovalence, Tables du Lexique-Grammaire, Lexique des Verbes Français, TreeLex) : constructions impersonnelles, adverbes en -ment, quelques classes d'expressions verbales figées (Sagot et Danlos 2006, Danlos et Sagot 2007, Sagot et Danlos 2007, Sagot et Fort 2007, Sagot et Danlos soumis) ; par ailleurs, un certain nombre des noms et adjectifs viennent initialement du lexique morphologique Multext pour le français (Véronis 1998).</dc:abstract>
  <dc:description>morphologie, syntaxe (valence, contrôle, montée, attributs, verbes supports, locutions figées…)</dc:description>
  <dc:source>Sagot 2010</dc:source>
  <dc:identifier xsi:type="dcterms:URI">http://atoll.inria.fr/~sagot/lefff.html</dc:identifier>
  <dcterms:created xsi:type="dcterms:W3CDTF">2024-22-12</dcterms:created>
  <dc:type/>
  <dc:format>text/Alexina</dc:format>
  <dc:type xsi:type="dcterms:DCMIType">Text</dc:type>
  </olac:olac>