Metadonnées à télécharger : Dublin Core | OLAC | DCMI (Clarin)
Description de la ressource | |
---|---|
Nom de la ressource | Language detector |
Description | Trouve la langue d'un texte grâce à l'algorithme suivant : * finds among the 20 most common characters of the text the most common unicode category. If this category is a letter (category starting with “L” : Ll=letter lower case, Lu=letter upper case, Lo=letter other) continue, if not (ie. Mostly other characters like ponctuation) give up. * Check among the 20 most common characters if the first word of the unicode name gives a unique language name |
URL | http://elizia.net/languageDetector/languageDetector.html |
Licence | GPL |
Droits d'accès | Téléchargement |
En lien avec | GrosMoteur |
Type d'outil | Détecteur de langue |
Langages de développement | Python |
Interface graphique | Non |
Formats d'entrée | TXT |