LabEx EFL

Fiche ressource

download Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceOpenSubtitles2011
DescriptionCollection de documents issus de http://www.opensubtitles.org/. 54 languages, 1,032 bitexts total number of files: 1,390,584 total number of tokens: 8.31G total number of sentence fragments: 1.22G
URLhttp://opus.lingfil.uu.se/OpenSubtitles_v2.php
Publication à citerJörg Tiedemann, 2009, News from OPUS - A Collection of Multilingual Parallel Corpora with Tools and Interfaces. In N. Nicolov and K. Bontcheva and G. Angelova and R. Mitkov (eds.) Recent Advances in Natural Language Processing (vol V), pages 237-248, John Benjamins, Amsterdam/Philadelphia
Droits d'accèsTéléchargement
Objectifs scientifiquesTraduction automatique, machine learning
ModalitéEcrit
Type de donnéesCorpus
Provenance des donnéesWeb (http://www.opensubtitles.org/)
Formats de fichiersXML, XCES
Taille des données (Mo)51 Go
Types d'informations linguistiquesAnnotations morpho-syntaxiques
Codage des caractèresUTF-8
État d'avancementAchevé
CommentairesIl existe une interface web pour interroger ce corpus : http://opus.lingfil.uu.se/bin/opuscqp.pl

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

LLF
StatutUtilisateur
Référent localClément Plancq
Adresse mailclement.plancq (at) linguist.jussieu.fr

Producteur

OrganismeJörg Tiedemann



Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin