How is it that so many intergalactic species in movies and TV just happen to speak perfect English? The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary. But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages. So is a universal translator possible in real life? We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit. And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans. The reality, however, is a bit more complicated. A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and set of rules to recognize the basic linguistic elements in the input language. For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins." It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural. Finally, it needs to understand the semantics, what the different parts of the sentence actually mean. To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language. But this is where it gets tricky. The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child. Morphology can also pose a problem. Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general. Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them. Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans. By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations. However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing. The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure. In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy. For now, learning a language the old fashioned way will still give you better results than any currently available computer program. But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation. Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
Nasıl oluyor da filmlerdeki ve TV'deki galaksiler arası uzaylıların hepsi dilimizi kusursuz biçimde konuşabiliyor? Kısa yanıt, uzaylı sözlüğü derlemeye yıllar harcayan bir uzay gemisi mürettebatını kimsenin izlemek istemeyecek olması. Ama tutarsızlık olmasın diye, Uzay Yolu dizisinin ve diğer bazı bilimkurgu dünyalarının yaratıcıları "evrensel çevirmen" kavramını ortaya atmışlardır: Her dili, her dile çevirebilen taşınabilir bir cihaz. Peki gerçek hayatta evrensel bir çevirmen yapmak mümkün mü? Bunu yaptığını iddia eden çok sayıda program zaten var; bir sözcük, cümle ya da komple bir kitap alıp, modern İngilizce'den Antik Sanskritçe'ye kadar neredeyse her dile çeviri yapılabildiğini söyleyen. Tabii eğer çeviri yapmak, sözcüklerin sözlükteki karşılıklarına bakmak olsaydı, bu programlar insanların elinden düşmezdi. Ama gerçekte o iş o kadar basit değil. Kural-tabanlı bir çeviri programı, sözcüksel bir veri tabanı kullanır. Orada, sözlükte bulunan tüm sözcükler, alabilecekleri tüm dilbilgisel biçimler vardır. Ayrıca girdi dilindeki temel dilsel öğelerin tanınması için kurallar dizisi bulunur. "Çocuklar keki yiyor," gibi görünüşte basit bir cümle için, program önce sözcük dizilimini, yani dilbilgisel yapıyı inceler. "Çocuklar"ı özne olarak saptar; geri kalan cümle öznenin yaptığı işi bildirir. Yüklem "yiyor" olur. Nesne ise "keki"dir. Ardından dilin şekilbilimsel çözümlemesine bakar; yani dilin nasıl anlamlı daha küçük birimlere ayrılabileceğini inceler. Örneğin "kek" sözcüğünün çoğul eki aldığını saptar. Son olarak, anlambilimsel açıdan ele alması gerekir. Cümlenin farklı parçalarının ne anlama geldiğini çözer. Bu cümleyi düzgün bir biçimde çevirmek için, program hedef dildeki her öğe için farklı sözcük hazinesine ve kurallara başvurur. İşlerin karıştığı nokta da orasıdır. Bazı dillerin söz dizilimi, sözcüklerin herhangi bir şekilde sıralanmasına izin verir. Bazı dillerde ise bunu yapmak, kekin çocukları yemesine neden olabilir. Şekilbilim de başa dert açabilir. Sloven dillinde iki çocuk ile ikiden fazla çocuğu ayırt etmek için ikili son ek kullanılır, ki bu pek çok dilde yoktur. Rusça'da belirli artikellerin olmaması, çocukların belli bir keki mi yediğini, yoksa genel anlamda kek yediklerini mi sorgulamanıza neden olabilir. Son olarak, anlam teknik olarak doğru olsa bile, program ince bir noktayı kaçırabilir. Çocuklar keki "mangiano" mu etmektedir, yoksa "divorano" mu, gibi. Bir diğer yöntem ise istatistiksel makine çevirisidir. İnsanlar tarafından önceden çevrilmiş kitapların, makalelerin ve dokümanların çözümlenmesine dayanır. Kaynak ve çeviri metinler arasındaki, şans eseri olamayacak karşılıkları bularak, program dillerde birbirine karşılık gelen ifade ve desenleri belirler ve gelecekte kendi çevirilerini buna göre yapar. Bununla birlikte, bu tür bir çevirinin kalitesi, baz alınan veri tabanının büyüklüğüne, belli dillerde örneklerin ve yazım tarzlarının ulaşılabilirliğine bağlıdır. İnsanların doğal olarak anlayabildiği, ama bilgisayarların içinden çıkamadığı istisnalar, düzensizlikler ve ince anlam farkları nedeniyle, araştırmacılar bizim dili anlayabiliyor oluşumuzu beynimizin biyolojik yapısının özgün bir sonucu olarak değerlendiriyor. Aslına bakarsanız, "Bir Otostopçunun Galaksi Rehberi"nde geçen ve kurgusal evrensel çevirmenlerin en ünlüsü olan "Babil Balığı" da bir makine değildi; bir tür telepati yöntemiyle duyarlı canlıların beyin dalgası ve sinirsel sinyalleri arasında çeviri yapıyordu. Şu anda bir dili eski moda yöntemlerle öğrenmek, hâlâ mevcut bilgisayar programlarının tümünden daha iyi sonuç veriyor. Tabii bu kolay iş değil. Üstelik dünyada öyle çok dil var ki. Onları konuşan insanlar arasındaki etkileşim arttığı sürece, otomatik çevirilerdeki ilerleme çalışmalarını sürdürmek kaçınılmaz. Belki biz galaksiler arası uzaylılarla karşılaşana kadar onlarla ufak bir cihaz kullanarak anlaşmanın da yolunu bulmuş oluruz. Ya da belki şimdiden o sözlüğü derlemeye başlasak fena olmaz.