Quelle langue est-ce? 5 outils pour identifier les langues inconnues

  • Lesley Fowler
  • 0
  • 2210
  • 591
Publicité

je??´ je›¹je'¬je??´jeŠ¸je-?? i ™˜je˜??. je??´ê²ƒì ?? € 보기 ì›?? 본je??´ë‹¤

Quelle langue est-ce? Chinois? Japonais?

C'est coréen en fait. Détecter cela manuellement m'aurait pris beaucoup de temps. Heureusement, j'ai trouvé des outils très précis qui peuvent le faire automatiquement. Ils sont tous énumérés ci-dessous.

L'expérience: J'ai testé les sites Web avec des exemples de texte (1-2 phrases de 8 mots) dans les langues suivantes: portugais, russe, coréen, vietnamien, italien, turc, polonais, ukrainien, azerbaïdjanais, slovène, macédonien, néerlandais, philippin (tagalog), Grec, galicien, tchèque, biélorusse, finlandais, tatar et norvégien.

Globalement, j'ai testé 20 langues différentes.

3 outils pour détecter le texte de langue inconnue

1. LangId (réussi 18 des 20 tests, pas réussi le tatar et le biélorusse)

Avantages: Globalement, excellent outil en ligne. Il offre une fonctionnalité de base de détection de texte et dispose également de robots de détection de courrier électronique et Twitter pour des résultats encore plus rapides..

Les inconvénients: Leur moteur est basé sur Google API, mais ils semblent avoir de meilleurs résultats que le détecteur de Google décrit ci-dessous. Il semble qu'ils sachent très bien utiliser les choses. Je n'ai pas aimé qu'ils n'aient pas leur propre algorithme unique pour détecter les langues.

2. Détecteur de langue de Google [n'est plus disponible] (a réussi 17 des 20 tests, n'a pas réussi le portugais, le taglog et le biélorusse)

Avantages: Google possède l'une des meilleures API au monde pour la détection de langue. Ce qui est bien, c’est que vous puissiez voir la probabilité que le résultat affiché soit vrai. Ils ont réussi la plupart des tests sur échantillons.

Les inconvénients: J'étais assez surpris qu'ils n'aient pas réussi le test de portugais. Il semble qu'ils ont un bogue (j'espère temporaire) avec ce langage. En outre, ils peuvent certainement faire un meilleur travail en améliorant la conception de la page..

3. Quelle langue est-ce (réussi 11 des 20 tests, pas réussi le russe, coréen, ukrainien, azerbaïdjanais, macédonien, tagalog, grec, galicien et tatar)

Avantages: Certaines langues comme les langues slaves du sud (serbe, croate, slovène) sont assez similaires. Si vous saisissez du texte en croate, par exemple, ce site Web vous indiquera que le texte peut également être en serbe ou en slovène..

Les inconvénients: Ils doivent travailler à rendre leur système de détection plus sophistiqué. Je pensais mettre Translated.net (un autre site Web pour la détection de langue) à la place de celui-ci, mais Translated a promis la détection de plus de langues et a en fait fait pire que WhatLanguageIsThis.com.

2 outils pour détecter des sites Web dans des langues inconnues

4. Google Traduction avec Détecter la langue comme première option

Passé: 18 sur 20, n'ont pas réussi le biélorusse et le tatar.

Avantages: Cet outil fait très bien son travail. Ce qui me plaît chez Google Translate Google Translate 2.1 s'affiche avec le support natif pour le clavier iOS 7 et plus, et plus encore. Google Translate 2.1 s'affiche avec le support linguistique natif pour iOS 7 et plus. Mettez à jour Google Translate 2.1 sur votre appareil iOS et continuez à prendre en charge la traduction. et prise en charge de l'écriture manuscrite pour les nouvelles langues. Google Translate obtient enfin un nouveau clavier iOS 7 pour faire tout… c'est que s'il ne prend pas en charge une langue spécifique, il affiche l'écran suivant:

C'est un excellent détecteur de langue si vous me demandez!

5. Microsoft Bing Translator avec Détection automatique comme première option.

Passé: 8 sur 20, n'ont pas réussi néerlandais, vietnamien, turc, ukrainien, azerbaïdjanais, slovène, macédonien, tagalog, grec, galicien, tchèque et biélorusse

Avantages: Il prend en charge un nombre limité de langues. Pour ces langues, il fait bien son travail.

Les inconvénients: Je suis très déçu de Microsoft. Ils ont un nombre très limité de langues pour la détection et la traduction. Top 4 des services de traduction en ligne Les 4 meilleurs services de traduction en ligne et leur fonction de détection automatique est horrible. Si vous entrez une langue qu’ils ne prennent pas en charge, vous obtiendrez un résultat erroné au lieu de vous indiquer qu’ils ne prennent pas cette langue en charge..

Pensées

Dans l’ensemble, j’estime que les outils ci-dessus vont dans la bonne direction. Ils sont actuellement les meilleurs pour détecter les langues en ligne et font assez bien leur travail dans le domaine des langues populaires. Cependant, ils doivent travailler sur l'ajout de langages plus obscurs (aucun outil n'a été capable de reconnaître Tatar) et je suis sûr que tous, en particulier Google, iront dans cette direction dans un proche avenir..

Crédit image: Kanko *




Personne n'a encore commenté ce post.

De la technologie moderne, simple et abordable.
Votre guide dans le monde de la technologie moderne. Apprenez à utiliser les technologies et les gadgets qui nous entourent chaque jour et à découvrir des choses intéressantes sur Internet.