Description de la ressource
Signaler une erreur
|
---|
Nom de la ressource | OpenSubtitles2011 |
Description | Collection de documents issus de http://www.opensubtitles.org/.
54 languages, 1,032 bitexts
total number of files: 1,390,584
total number of tokens: 8.31G
total number of sentence fragments: 1.22G |
URL | http://opus.lingfil.uu.se/OpenSubtitles_v2.php |
Publication à citer | Jörg Tiedemann, 2009, News from OPUS - A Collection of Multilingual Parallel Corpora with Tools and Interfaces. In N. Nicolov and K. Bontcheva and G. Angelova and R. Mitkov (eds.) Recent Advances in Natural Language Processing (vol V), pages 237-248, John Benjamins, Amsterdam/Philadelphia |
Droits d'accès | Téléchargement |
Objectifs scientifiques | Traduction automatique, machine learning |
Modalité | Ecrit |
Type de données | Corpus |
Provenance des données | Web (http://www.opensubtitles.org/) |
Formats de fichiers | XML, XCES |
Taille des données (Mo) | 51 Go |
Types d'informations linguistiques | Annotations morpho-syntaxiques |
Codage des caractères | UTF-8 |
État d'avancement | Achevé |
Commentaires | Il existe une interface web pour interroger ce corpus : http://opus.lingfil.uu.se/bin/opuscqp.pl |