Description de la ressource
Signaler une erreur
|
|---|
| Nom de la ressource | French Treebank |
| Description | Corpus arboré du français. 24000 phrases (780 000 mots) issues d'articles du quotidien Le Monde parus entre 1989 et 1995. Le corpus a trois niveaux d'annotation : annotation morpho-syntaxique (POS), annotation en constituants, annotation en fonctions grammaticales (pour une sous-partie du corpus). Le corpus est distribué gratuitement à des fins de recherche. |
| URL | http://www.llf.cnrs.fr/fr/french_treebank |
| Publication à citer | Abeillé, A., L. Clément, and F. Toussenel. 2003. `Building a treebank for French', in A. Abeillé (ed) Treebanks , Kluwer, Dordrecht. |
| Droits d'accès | Envoi sur demande |
| Modalité | Ecrit |
| Type de données | Corpus |
| Provenance des données | Presse (Le Monde) |
| Formats de fichiers | XML |
| Taille des données (Mo) | 209 Mo |
| Langue(s) | French |
| Types d'informations linguistiques | Annotations morpho-syntaxiques, annotation syntaxiques, annotation des fonctions grammaticales |
| Codage des caractères | ISO-8859-1 |
| État d'avancement | Achevé |