How is it that so many intergalactic species in movies and TV just happen to speak perfect English? The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary. But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages. So is a universal translator possible in real life? We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit. And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans. The reality, however, is a bit more complicated. A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and set of rules to recognize the basic linguistic elements in the input language. For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins." It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural. Finally, it needs to understand the semantics, what the different parts of the sentence actually mean. To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language. But this is where it gets tricky. The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child. Morphology can also pose a problem. Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general. Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them. Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans. By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations. However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing. The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure. In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy. For now, learning a language the old fashioned way will still give you better results than any currently available computer program. But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation. Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
Comment se fait-il que tant de races intergalactiques dans les films et les séries parlent parfaitement l'anglais ? La réponse courte est que personne ne veut voir l'équipage d'un vaisseau passer des années à compiler un dictionnaire alien. Mais pour la cohérence de la chose, les créateurs de Star Trek et d'autres mondes de science-fiction ont introduit le concept d'un traducteur universel, un appareil portatif qui peut traduire instantanément n'importe quelle langue. Peut-on créer un traducteur universel dans la vraie vie ? Il existe déjà de nombreux programmes qui prétendent pourvoir faire cela, en prenant un mot, une phrase, ou un livre entier dans une langue et le traduire dans quasiment n'importe quelle autre langue, que ce soit l'anglais moderne ou l'ancien sanskrit. Et si pour traduire, il suffisait de chercher des mots dans un dictionnaire, ces programmes seraient partout. La réalité est, cependant, un peu plus compliquée. Un programme de traduction basé sur des règles utilise une base de données lexicale, qui inclut tous les mots trouvés dans un dictionnaire et toutes les formes grammaticales qu'elles peuvent contenir, et un jeu de règles permettant de reconnaître les bases des éléments linguistiques de la langue source. Pour un phrase apparemment simple comme « les enfants mangent les muffins », le programme analyse la syntaxe, ou la structure grammaticale, en identifiant « les enfants » comme sujet et le reste de la phrase comme prédicat consistant du verbe « mangent » et du complément d'objet direct « les muffins ». Il doit ensuite reconnaître la morphologie anglaise, ou la séparation de la langue dans ses plus petites unités ayant un sens, comme le mot « muffin » et le suffixe « s », utilisé pour indiquer le pluriel. De plus, il a besoin de comprendre la sémantique, ce que les différentes parties de la phrase veulent dire. Pour traduire cette phrase correctement, le programme devra consulter un jeu de règles et de vocabulaires différents pour chaque élément de la langue cible. Mais c'est là que ça devient compliqué. La syntaxe de certaines langues permet aux mots d'être désordonnés, alors que dans d'autres, cela pourrait conduire au « muffin mange l'enfant ». La morphologie pose aussi un problème. En slovène, on distingue entre deux ans et plus en utilisant d'un double suffixe absent dans la plupart des autres langues, lorsqu'en russe le manque d'articles définis vous fera demander si les enfants mangeaient un type particulier de muffins, ou juste des muffins en général. Finalement, même quand la sémantique est techniquement correcte, le programme peut manquer les points plus complexes, comme si les enfants ont « mangé » les muffins, ou s'ils les ont « dévorés ». L'autre méthode est une machine de traduction statistique, qui analyse une base de données de livres, d'articles et de documents qui ont déjà été traduits par des humains. En trouvant des correspondances entre la source et le texte traduit qui ont peu de chance de se produire par accident, le programme peut identifier des expressions et des schémas correspondants, et les utiliser pour des traductions futures. Cependant, la qualité de ce type de traduction dépend de la taille de la base de données initiale et de la disponibilité d’échantillons pour certaines langues ou styles d'écriture. La difficulté que les ordinateurs ont avec les exceptions, les irrégularités et les nuances du sens qui semblent être instinctives pour les humains a amené certains chercheurs à penser que notre compréhension du langage est un produit propre à la structure biologique de notre cerveau. En fait, un des traducteurs universels fictifs les plus connus, le poisson Babel du « Guide du voyageur galactique », n'est pas du tout une machine, mais une petite créature qui traduit les ondes cérébrales et les signaux nerveux de races sensibles grâce à une forme de télépathie. Pour l'instant, apprendre une langue à l'ancienne vous donnera de meilleurs résultats que n'importe quel logiciel existant. Mais ce n'est pas facile, et le simple nombre de langues dans le monde, en plus des interactions croissantes de personnes qui les parlent, vont seulement continuer à stimuler des avancées dans la traduction automatique. Peut-être que lorsque nous rencontrerons des formes de vie intergalactiques, nous serons capables de communiquer avec eux à travers un petit dispositif, ou peut-être que nous devrons quand même compiler ce petit dictionnaire après tout.