LabEx EFL

Fiche ressource

download Metadonnées à télécharger : Dublin Core | TEI | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceMULTEXT-East corpus
DescriptionThe MULTEXT-East resources are a multilingual dataset for language engineering research and development. This dataset contains, for Bulgarian, Croatian, Czech, English, Estonian, Hungarian, Lithuanian, Macedonian, Persian, Polish, Resian, Romanian, Russian, Serbian, Slovak, Slovene, and Ukrainian, some, or all of the following language resources: the MULTEXT-East morphosyntactic specifications, lexica, and annotated "1984" corpus; the MULTEXT-East parallel and comparable text and speech corpora; and associated documentation.
URLhttp://nl.ijs.si/ME/
Projet associéMultilingual Text Tools and Corpora
Droits d'accèsNon renseigné
ModalitéEcrit
Type de donnéesCorpus
Formats de fichiersXML (TEI P5)
Langue(s)Bulgarian, Croatian, Czech, English, Estonian, Hungarian, Lithuanian, Macedonian, Persian, Polish, Resian, Romanian, Russian, Serbian, Slovak, Slovene, and Ukrainian
Types d'informations linguistiquesMorphosyntactic annotations
État d'avancementAchevé

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

ALPAGE
StatutUtilisateur
Référent localBenoît Sagot
Adresse mailbenoit.sagot (at) inria.fr

Producteur

OrganismeDept. of Knowledge Technologies - Jožef Stefan Institute
ContactTomaž Erjavec



Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin