Description de la ressource
Signaler une erreur
|
---|
Nom de la ressource | French Treebank |
Description | Corpus arboré du français. 24000 phrases (780 000 mots) issues d'articles du quotidien Le Monde parus entre 1989 et 1995. Le corpus a trois niveaux d'annotation : annotation morpho-syntaxique (POS), annotation en constituants, annotation en fonctions grammaticales (pour une sous-partie du corpus). Le corpus est distribué gratuitement à des fins de recherche. |
URL | http://www.llf.cnrs.fr/fr/french_treebank |
Publication à citer | Abeillé, A., L. Clément, and F. Toussenel. 2003. `Building a treebank for French', in A. Abeillé (ed) Treebanks , Kluwer, Dordrecht. |
Droits d'accès | Envoi sur demande |
Modalité | Ecrit |
Type de données | Corpus |
Provenance des données | Presse (Le Monde) |
Formats de fichiers | XML |
Taille des données (Mo) | 209 Mo |
Langue(s) | French |
Types d'informations linguistiques | Annotations morpho-syntaxiques, annotation syntaxiques, annotation des fonctions grammaticales |
Codage des caractères | ISO-8859-1 |
État d'avancement | Achevé |