Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)
Description de la ressource | |
---|---|
Nom de la ressource | Europarl3 |
Description | Corpus parallèle issu du site du Parlement Européen. Environ 40 millions de mots par langue, 11 langues (da, de, el, en, es, fi, fr, it, nl, pt, sv). 11 languages, 55 bitexts (3.5 G) total number of files: 7,034 total number of tokens: 404.01M total number of sentence fragments: 15.81M |
URL | http://opus.lingfil.uu.se/Europarl3.php |
Publication à citer | Jörg Tiedemann, 2009, News from OPUS - A Collection of Multilingual Parallel Corpora with Tools and Interfaces [pdf] In N. Nicolov and K. Bontcheva and G. Angelova and R. Mitkov (eds.) Recent Advances in Natural Language Processing (vol V), pages 237-248, John Benjamins, Amsterdam/Philadelphia |
Droits d'accès | Téléchargement |
Objectifs scientifiques | Traduction automatique, machine learning |
LLF | |
---|---|
Statut | Utilisateur |
Référent local | Clément Plancq |
Adresse mail | clement.plancq (at) linguist.jussieu.fr |
Organisme | Jörg Tiedemann |