Fiche ressource

download Metadonnées à télécharger : Dublin Core | OLAC | DCMI (Clarin)

Description de la ressource Modifier Signaler une erreur
Nom de la ressourceLanguage detector
DescriptionTrouve la langue d'un texte grâce à l'algorithme suivant : * finds among the 20 most common characters of the text the most common unicode category. If this category is a letter (category starting with “L” : Ll=letter lower case, Lu=letter upper case, Lo=letter other) continue, if not (ie. Mostly other characters like ponctuation) give up. * Check among the 20 most common characters if the first word of the unicode name gives a unique language name
Droits d'accèsTéléchargement
En lien avecGrosMoteur
Type d'outilDétecteur de langue
Langages de développementPython
Interface graphiqueNon
Formats d'entréeTXT

Personnes à contacter (internes au LabEx)

RéférentAjouter un référent

Valid XHTML 1.0! Valid CSS! Licence Creative Commons Admin