How is it that so many intergalactic species in movies and TV just happen to speak perfect English? The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary. But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages. So is a universal translator possible in real life? We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit. And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans. The reality, however, is a bit more complicated. A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and set of rules to recognize the basic linguistic elements in the input language. For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins." It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural. Finally, it needs to understand the semantics, what the different parts of the sentence actually mean. To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language. But this is where it gets tricky. The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child. Morphology can also pose a problem. Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general. Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them. Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans. By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations. However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing. The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure. In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy. For now, learning a language the old fashioned way will still give you better results than any currently available computer program. But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation. Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
¿Cómo es posible que tantas especies intergalácticas en películas y series resulten hablar inglés perfecto? La respuesta breve es que nadie quiere ver a un equipo de la nave pasar años compilando un diccionario alienígena. Pero para mantener la consistencia, los creadores de Star Trek y otros mundos de ciencia ficción introdujeron el concepto de traductor universal, un dispositivo portable que traduce al instante entre cualquier idioma. ¿Es posible un traductor universal en la vida real? Ya tenemos muchos programas que dicen hacer exactamente eso, tomar una palabra, una oración, o un libro entero en un idioma y traducirlo a casi cualquier otro, sea inglés moderno o sánscrito antiguo. Y si la traducción fuera solo cuestión de buscar palabras en un diccionario, estos programas superarían a los humanos. La realidad, sin embargo, es un poco más complicada. Un programa de traducción basado en reglas, usa una base de datos léxica que tiene todas las palabras que uno encuentra en un diccionario y las formas gramaticales que estas pueden adoptar y reglas para reconocer los elementos lingüísticos básicos en el idioma de entrada. Para una oración aparentemente simple como "The children eat the muffins", el programa primero analiza su sintaxis, o estructura gramatical, identificando "children" [niños] como sujeto, y el resto de la oración como predicado que tiene un verbo "eat" [comer], y un objeto directo "the muffins". Luego tiene que reconocer la morfología del inglés, o cómo descomponer el idioma en unidades significativas más pequeñas, como la palabra "muffin" y el sufijo "s", usado para indicar el plural. Finalmente, tiene que entender la semántica, qué significan realmente las partes de la oración. Para traducir esta oración de manera apropiada, el programa hará referencia a distintos vocabularios y reglas para cada elemento del idioma destino. Pero aquí la cosa se complica. La sintaxis de algunos idiomas permiten ordenar palabras en cualquier orden, mientras que otras, harían que el "muffin" se coma al niño. La morfología puede también suponer un problema. El esloveno distingue entre dos niños y tres o más mediante un sufijo dual ausente en muchos otros idiomas, mientras que la falta de artículos definidos del ruso podría dejar la duda de si los niños están comiendo algunos muffins en particular, o solo comen muffins en general. Finalmente, incluso si la semántica es técnicamente correcta, el programa puede errar en sus puntos más finos, por ejemplo si los niños "comen" los muffins, o los "devoran". Otro método es la traducción automática estadística, que analiza una base de datos de libros, artículos y documentos que ya ha sido traducida por humanos. Encontrando concordancias entre textos fuente y traducidos, que es poco probable que ocurran por casualidad, el programa puede identificar frases y patrones que se corresponden, y usarlos para futuras traducciones. Sin embargo, la calidad de este tipo de traducción depende del tamaño de la base de datos inicial y la disponibilidad de muestras para ciertos idiomas o estilos de escritura. La dificultad que tienen las máquinas con las excepciones, irregularidades y los matices de significado que parecen instintivos a los humanos llevaron a algunos investigadores a creer que la comprensión de la lengua es un producto único de la estructura cerebral biológica. De hecho, uno de los traductores universales más famosos de la ficción, el pez Babel de "The Hitchhiker's Guide to the Galaxy", no es una máquina sino una pequeña criatura que traduce las ondas cerebrales y las señales nerviosas de especies sensibles mediante una forma de telepatía. Por ahora, aprender un idioma a la antigua todavía dará mejores resultados que los programas informáticos actuales. Pero esto no es tarea fácil, y la inmensa cantidad de idiomas del mundo, así como la creciente interacción de las personas que los hablan, no hará más que estimular un mayor avance en la traducción automática. Quizá cuando encontremos formas de vida intergalácticas, podremos comunicarnos con ellos a través de un pequeño aparatito, o puede que empecemos a compilar ese diccionario, después de todo.