LabEx EFL

Fiche ressource

download Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceEuroparl3
DescriptionCorpus parallèle issu du site du Parlement Européen. Environ 40 millions de mots par langue, 11 langues (da, de, el, en, es, fi, fr, it, nl, pt, sv). 11 languages, 55 bitexts (3.5 G) total number of files: 7,034 total number of tokens: 404.01M total number of sentence fragments: 15.81M
URLhttp://opus.lingfil.uu.se/Europarl3.php
Publication à citerJörg Tiedemann, 2009, News from OPUS - A Collection of Multilingual Parallel Corpora with Tools and Interfaces [pdf] In N. Nicolov and K. Bontcheva and G. Angelova and R. Mitkov (eds.) Recent Advances in Natural Language Processing (vol V), pages 237-248, John Benjamins, Amsterdam/Philadelphia
Droits d'accèsTéléchargement
Objectifs scientifiquesTraduction automatique, machine learning
ModalitéEcrit
Type de donnéesCorpus
Provenance des donnéesWeb (Parlement Européen)
Formats de fichiersXML, XCES
Taille des données (Mo)3,5 Go
Langue(s)Danish, Greek, English, Spanish, Finnish, French, Italian, Dutch, Polish, Portuguese, Slovak
Types d'informations linguistiquesAnnotations morpho-syntaxiques
Codage des caractèresUTF-8
État d'avancementAchevé

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

LLF
StatutUtilisateur
Référent localClément Plancq
Adresse mailclement.plancq (at) linguist.jussieu.fr

Producteur

OrganismeJörg Tiedemann



Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin