How is it that so many intergalactic species in movies and TV just happen to speak perfect English? The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary. But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages. So is a universal translator possible in real life? We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit. And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans. The reality, however, is a bit more complicated. A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and set of rules to recognize the basic linguistic elements in the input language. For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins." It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural. Finally, it needs to understand the semantics, what the different parts of the sentence actually mean. To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language. But this is where it gets tricky. The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child. Morphology can also pose a problem. Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general. Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them. Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans. By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations. However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing. The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure. In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy. For now, learning a language the old fashioned way will still give you better results than any currently available computer program. But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation. Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
Bagaimana caranya banyak makhluk luar angkasa di film-film bisa kebetulan lancar berbahasa Inggris? Jawaban singkatnya, tidak ada yang mau melihat seorang kru kapal angkasa menyusun kamus bahasa alien selama bertahun-tahun. Namun, demi menjaga konsistensi, pencipta Star Trek dan dunia fiksi ilmiah lainnya memperkenalkan konsep penerjemah universal, alat portabel yang secara instan menerjemahkan bermacam bahasa. Jadi, apakah penerjemah universal mungkin ada di kehidupan nyata? Kini sudah ada beberapa program yang mengklaim bisa melakukannya, mengambil sebuah kata, kalimat, atau seluruh isi buku dalam satu bahasa dan menerjemahkannya ke hampir semua bahasa lain, seperti Inggris modern atau Sansekerta kuno. Jika penerjemahan hanya soal mencari kata-kata di kamus, program-program ini akan melampaui manusia. Namun, kenyataannya sedikit lebih rumit. Program terjemahan berbasis aturan menggunakan pangkalan data leksikal, yang memasukkan semua kata dalam kamus dan bentuk gramatikal yang ada, dan membuat aturan untuk mengenali dasar elemen linguistik dalam bahasa input. Untuk kalimat yang tampak simpel seperti, "Anak-anak makan bolu", pertama-tama program memilah sintaksnya, atau struktur tata bahasa, dengan mengidentifikasi 'anak-anak' sebagai subjek, dan bagian lain kalimat sebagai predikat terdiri atas verba 'makan', dan objek langsung 'bolu'. Lalu program harus mengenali morfologi bahasa Inggris, atau bagaimana bahasa dapat diuraikan ke dalam unit terkecil yang bermakna, seperti kata 'bolu' dan akhiran "-s", yang digunakan untuk menyatakan benda jamak. Akhirnya, program harus mengerti semantik, apa makna sebenarnya dari bagian kalimat yang berbeda. Untuk menerjemahkan secara tepat, program akan merujuk ke perangkat kosakata dan aturan yang berbeda untuk tiap elemen dalam bahasa target. Namun, di sini letak kesulitannya. Sintaks beberapa bahasa memungkinkan kata-kata diatur dalam urutan apa pun, sementara di bahasa lain, bisa menjadi 'bolu makan anak-anak'. Morfologi bisa juga menjadi masalah. Bahasa Slovenia membedakan dua anak, tiga, atau lebih menggunakan akhiran ganda yang tidak ada dalam banyak bahasa lain, minim partikel di bahasa Rusia mungkin membingungkan apakah (anak-anak makan bolu jenis tertentu), atau hanya bolu secara umum. Akhirnya, meskipun semantik benar secara teknis, program ini mungkin melewatkan inti makna, misalkan apakah anak-anak itu "memakan" bolu, atau "melahap". Metode lainnya yaitu penerjemahan mesin statistik, yang menganalisis pangkalan data beberapa buku, artikel, dan dokumen yang telah diterjemahkan manusia. Dengan mencari kecocokan antara sumber dan teks yang sudah diterjemahkan yang tidak mungkin terjadi kebetulan, program ini bisa mengidentifikasi hubungan frasa dan pola, dan menggunakannya untuk terjemahan berikutnya . Namun, kualitas penerjemahan jenis ini bergantung pada ukuran pangkalan data awal dan ketersediaan sampel untuk bahasa atau gaya penulisan tertentu. Kesulitan yang dimiliki komputer dengan pengecualian, penyimpangan, dan ragam makna yang naluriah bagi manusia telah membuat beberapa peneliti percaya bahwa pemahaman kita dalam berbahasa adalah produk unik dari struktur biologis otak. Bahkan, salah satu penerjemah universal fiktif yang paling terkenal, ikan Babel dari film "The Hitchhiker's Guide to the Galaxy", sama sekali bukan mesin, melainkan hewan kecil yang menerjemahkan gelombang otak dan sinyal syaraf spesies lain dengan cara telepati. Saat ini, belajar bahasa dengan cara biasa masih memberi hasil yang lebih baik daripada program komputer yang tersedia. Namun ini bukan tugas mudah, dan jumlah bahasa di dunia, juga pertumbuhan interaksi antar masyarakat, akan terus memacu kemajuan lebih besar dalam terjemahan otomatis. Mungkin pada saat kita menjumpai kehidupan lain di luar angkasa, kita akan bisa berkomunikasi dengan mereka dengan sebuah alat kecil, atau mungkin kita harus mulai menyusun kamusnya.