LabEx EFL

Fiche ressource

download Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceFrench Treebank
DescriptionCorpus arboré du français. 24000 phrases (780 000 mots) issues d'articles du quotidien Le Monde parus entre 1989 et 1995. Le corpus a trois niveaux d'annotation : annotation morpho-syntaxique (POS), annotation en constituants, annotation en fonctions grammaticales (pour une sous-partie du corpus). Le corpus est distribué gratuitement à des fins de recherche.
URLhttp://www.llf.cnrs.fr/fr/french_treebank
Publication à citerAbeillé, A., L. Clément, and F. Toussenel. 2003. `Building a treebank for French', in A. Abeillé (ed) Treebanks , Kluwer, Dordrecht.
Droits d'accèsEnvoi sur demande
ModalitéEcrit
Type de donnéesCorpus
Provenance des donnéesPresse (Le Monde)
Formats de fichiersXML
Taille des données (Mo)209 Mo
Langue(s)French
Types d'informations linguistiquesAnnotations morpho-syntaxiques, annotation syntaxiques, annotation des fonctions grammaticales
Codage des caractèresISO-8859-1
État d'avancementAchevé

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

LLF
StatutProducteur
Référent localAnne Abeillé
Adresse mailanne.abeille (at) linguist.jussieu.fr



Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin