LabEx EFL


[Retour à la fiche]

Metadonnées au format CLARIN

   <?xml version="1.0" encoding="UTF-8"?>
<CMD xmlns="http://www.clarin.eu/cmd/"
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
     xmlns:dc="http://purl.org/dc/elements/1.1/"
     xmlns:dcterms="http://purl.org/dc/terms/"
     xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
     xmlns:defns="http://www.openarchives.org/OAI/2.0/"
     xmlns:olac="http://www.language-archives.org/OLAC/1.0/"
     xmlns:olac11="http://www.language-archives.org/OLAC/1.1/"
     CMDVersion="1.1"
     xsi:schemaLocation="http://www.clarin.eu/cmd/ http://catalog.clarin.eu/ds/ComponentRegistry/rest/registry/profiles/clarin.eu:cr1:p_1288172614026/xsd">
   <Header>
      <MdCreator>olac2cmdi.xsl</MdCreator>
      <MdCreationDate/>
      <MdSelfLink/>
      <MdProfile>clarin.eu:cr1:p_1288172614026</MdProfile>
      <MdCollectionDisplayName/>
   </Header>
   <Resources>
      <ResourceProxyList>
         <ResourceProxy id="d1e30">
            <ResourceType>Resource</ResourceType>
            <ResourceRef>http://atoll.inria.fr/~sagot/lefff.html</ResourceRef>
         </ResourceProxy>
      </ResourceProxyList>
      <JournalFileProxyList/>
      <ResourceRelationList/>
   </Resources>
   <Components>
      <OLAC-DcmiTerms>
         <abstract>Le Lefff est un lexique morphologique et syntaxique à large couverture (Sagot 2010). Il est développé au sein de l'architecture Alexina (Architecture pour les LEXiques INformatiques et leur Acquisition), en parallèle à d'autres lexiques utilisant le même format. Cette architecture est à deux niveaux :
- lexique intensionnel, qui décrit pour chaque entrée lexicale son lemme (forme canonique + table de flexion) et des informations de syntaxe profonde (cadre de sous-catégorisation en fonctions syntaxiques profondes et réalisations possibles + constructions/reformulations/diathèses admissibles)
- lexique extensionnel, compilé automatiquement à partir du lexique intensionnel ; ce processus de génération comporte une phase de flexion, en fonction de la classe morphologique associée à l’entrée intensionnelle, puis une phase de construction de la structure syntaxique associée à chacune des formes fléchie obtenues (les informations syntaxiques variant d’une forme à une autre, en particulier pour les formes infinitives et participiales, et en fonction de chaque construction associée à l'entrée).

Les informations lexicales présentes dans le Lefff sont issues de divers travaux :
- acquisition automatique (avec validation manuelle) à l'aide de techniques statistiques appliquées sur des corpus bruts (Clément, Sagot et Lang 2004, Sagot 2005),
- acquisition automatique (avec validation manuelle) d'informations syntaxiques atomiques (cf thèse de Sagot, 2006, ch 7)
- correction et ajout manuel ou guidé par des techniques automatiques, comme par exemple la fouille d'erreurs dans les sorties d'analyseurs syntaxiques (Sagot et de La Clergerie, 2006),
- comparaison avec d'autres ressources (Dicovalence, Tables du Lexique-Grammaire, Lexique des Verbes Français, TreeLex) : constructions impersonnelles, adverbes en -ment, quelques classes d'expressions verbales figées (Sagot et Danlos 2006, Danlos et Sagot 2007, Sagot et Danlos 2007, Sagot et Fort 2007, Sagot et Danlos soumis) ; par ailleurs, un certain nombre des noms et adjectifs viennent initialement du lexique morphologique Multext pour le français (Véronis 1998).</abstract>
         <accessRights>T&eacute;l&eacute;chargement</accessRights>
         <created dcterms-type="W3CDTF">2024-22-12</created>
         <creator>Benoît Sagot</creator>
         <description/>
         <format/>
         <identifier dcterms-type="URI">http://atoll.inria.fr/~sagot/lefff.html</identifier>
         <language/>
         <license>LGPL-LR</license>
         <provenance/>
         <publisher>ALPAGE : Analyse linguistique profonde à grande échelle</publisher>
         <source/>
         <title>Lefff (Lexique des formes fléchies du français)</title>
         <type olac-linguistic-type="primary_text"/>
         <type olac-discourse-type="narrative"/>
         <type dcterms-type="DCMIType">Sound</type>
         <type/>
      </OLAC-DcmiTerms>
   </Components>
</CMD>