How is it that so many intergalactic species in movies and TV just happen to speak perfect English? The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary. But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages. So is a universal translator possible in real life? We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit. And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans. The reality, however, is a bit more complicated. A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and set of rules to recognize the basic linguistic elements in the input language. For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins." It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural. Finally, it needs to understand the semantics, what the different parts of the sentence actually mean. To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language. But this is where it gets tricky. The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child. Morphology can also pose a problem. Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general. Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them. Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans. By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations. However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing. The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure. In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy. For now, learning a language the old fashioned way will still give you better results than any currently available computer program. But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation. Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
این چطور است که بسیاری از موجودات فضایی در فیلم های سینمایی و تلویزیونی ار قضا خیلی خوب انگلیسی صحبت می کنند؟ پاسخ کوتاه این است که هیچ کس نمی خواهد خدمه یک کشتی فضایی را ببیند که سالها صرف تدوین یک فرهنگ لغاتِ فضایی کرده اند. اما برای منسجم نگه داشتن مسائل، سازندگان [سریالِ] استار ترک و سایر دنیاهای علمی-تخیلی مفهوم یک مترجمِ عمومی را معرفی کردند، یک ابزار قابل حمل که می تواند بلافاصله هر زبانی را ترجمه کند. خُب، آیا یک مترجم عمومی در دنیای واقعی امکان پذیر است؟ همین الان هم تعداد زیادی برنامه داریم که ادعا می کنند این کار را انجام می دهند، یک کلمه، جمله یا یک کتاب کامل را از یک زبان می گیرند و آن را به تقریبا هر زبانی ترجمه می کنند، چه انگلیسیِ مدرن باشد یا سانسکریت باستانی. و اگر ترجمه فقط مسئله پیدا کردن کلمات در فرهنگ لغات بود، این نرم افزارها از همه آدمها جلو می زدند. اما واقعیت کمی پیچیده تر است. یک برنامه مترجم قانونمند از بانک اطلاعات کلماتی استفاده می کند که حاوی تمام کلمات موجود در فرهنگِ لغات و تمام حالت های دستوری آنها، و تمام قوانین لازم برای شناسایی اجزاء زبانیِ زبانِ مبداء است. به عنوان یک مثال ساده درباره جمله ای مثل "کودکان کلوچه می خورند،" برنامه اول بخش های آن یا ساختار دستوری آن را تجزیه می کند، کودکان را به عنوان فاعل، و بقیه جمله را به عنوان خبر شناسایی می کند که شامل فعل "می خورند،" و مفعول "کلوچه ها" است. و بعد برنامه باید شکل زبان انگلیسی را شناسایی کند. یا اینکه زبان چگونه می تواند به کوچکترین بخش های معنی دار تقسیم شود. مثل کلمه کلوچه و پسوند "s" که آن را تبدیل به جمع می کند. در نهایت، او باید معنی لغات را تشخیص دهد، هر بخش جمله در واقع چه معنی دارند. برای ترجمه مناسب این جمله، برنامه به مجموعه متفاوتی از لغات و دستوربرای هر جزء تشکیل دهنده در زبان مقصد مراجعه می کند. اما اینجای کار کمی سخت می شود. قوائد برخی زبان ها به کلمات اجازه می دهند تا در جاهای مختلف جمله قرار بگیرند، که در این صورت، ممکن است جمله به کلوچه بچه ها را می خورد تبدیل شود. شکلِ زبان هم ممکن است مشکل ساز شود. زبان اسلوونی بین دو کودک و سه یا بیشتر تفاوت قائل می شود در حالی که استفاده از مثنی در بسیاری از زبان ها وجود ندارد، با وجود نداشتن نکره و معرفه در زبان روسی شما نمی توانید متوجه شوید که بچه ها کلوچه های خاصی را می خورند، یا به طور کلی کلوچه می خورند. در نهایت، زمانی که معانی از نظر فنی هم درست باشند، برنامه ممکن است نتواند بهترین لغت را تشخیص دهد، مثل این که بچه ها کلوچه ها را "mangiano"، یا کلوچه ها را "divorano". [اشاره به استفاده از دو فعل با معانی شبیه ولی متفاوت در زبان لاتین] روش دیگر استفاده از دستگاه ترجمه آماری است، که بانک اطلاعاتی شامل کتابها، مقاله ها و مطالب را، که قبلا توسط انسان ترجمه شده اند، تحلیل می کند. با پیدا کردن معادل در میان زبان های مبدا و مقصد، که بعید است به صورت اتفاقی به وجود بیایند، نرم افزار می تواند جمله ها و الگوهای متناظر را بیابد، و از آنها برای ترجمه های آتی استفاده کند. با این وجود، کیفیت این نوع ترجمه به اندازه بانک اطلاعاتی مورد استفاده و وجود داشتن نمونه هایی از زبان خاص یا روش نوشتار، بستگی دارد. دشواری که رایانه ها با آن مواجه هستند برای شناسایی موارد خاص، بی قاعده و معانی نهفته که به صورت غریزی مربوط به انسان ها است بعضی از محققان را بر آن داشته تا باور کنند که درک ما از زبان محصولی خاص از ساختار بیولوژیکی مغز ما است. در واقع، یکی از مشهورترین مترجمان عمومیِ تخیلی، ماهیِ بابل در فیلم "راهنمای رایگانسواری در کهکشان"، اصلا ماشین نیست بلکه موجودی کوچک است که امواج مغزی و سیگنال های عصبی گونه های حساس را بوسیله گونه ای تلپاتی، ترجمه می کند. تا کنون، یاد گرفتن یک زبان به همان روش سنتی قدیمی نتیجه بهتری نسبت به استفاده از هر برنامه کامپیتری موجود به شما می دهد. اما این اصلا کار راحتی نیست، و با توجه به تعداد بسیار زیاد زبان های موجود در دنیا، تنها با افزایش تعامل میان افرادی که به آن زبان ها صحبت می کنند، می توان کارآیی مترجمان خودکار را بهبود بخشید. شاید زمانی که با حیات غیر زمینی برخورد پیدا کردیم، بتوانیم با آنها بوسیله یک ابزار کوچک ارتباط برقرار کنیم، یا شاید در نهایت مجبور شویم یک فرهنگ لغات گرد آوری کنیم.