How many of you had to fill out a web form where you've been asked to read a distorted sequence of characters like this? How many of you found it really annoying?
چند نفر از شما تاکنون فرمهای اینترنتی رو پر کردید وقتی که از شما خواسته میشه کاراکترهای بهم ریخته ای مثل این رو بخونید چه تعداد از شما اون رو ناراحت کننده یافتید بسیار خوب من اون رو اختراع کردم
(Laughter)
OK, outstanding. So I invented that.
خنده حضار
(Laughter)
ویا من جزو افرادی بودم که این کار رو انجام دادن
Or I was one of the people who did it. That thing is called a CAPTCHA. And it is there to make sure you, the entity filling out the form, are a human and not a computer program that was written to submit the form millions of times. The reason it works is because humans, at least non-visually-impaired humans, have no trouble reading these distorted characters, whereas programs can't do it as well yet. In the case of Ticketmaster, the reason you have to type these characters is to prevent scalpers from writing a program that can buy millions of tickets, two at a time.
که با نام فایل (کپچا) میشناسیم و دلیل اون اینکه مطمئین شوند کسی که فرم رو پر میکنه واقعا یک انسانه و نه یک نوع برنامه کامپیوتری که برای ارسال فرم میلیون ها و میلیون ها بار نوشته شده بود. دلیل کار اون به خاطر انسانهاست حداقل انسانها بدون مشکل میتوانند کلمات متوالی بهم ریخته را بخوانند و از آنجا که برنامه ها ی کامپیوتری هنوز نمیتوانند آن را به خوبی بخوانند برای مثال ، در این وب سایت فروش بلیط دلیل نوشتن این کلمات بهم ریخته ممانعت سارقان از نوشتن برنامه هایی است که میتونن میلیونها بلیط رو در یک لحظه خرید کنند .
CAPTCHAs are used all over the Internet. And since they're used so often, a lot of times the sequence of random characters shown to the user is not so fortunate. So this is an example from the Yahoo registration page. The random characters that happened to be shown to the user were W, A, I, T, which, of course, spell a word. But the best part is the message that the Yahoo help desk got about 20 minutes later.
کپچا در تمامی صفحات وب استفاده میشود بنابراین اغلب از آنها استفاده میشود به صورت توالی دقیقی از کاراکترها به صورت تصادفی که به کاربر نشان داده میشوند که بسیار هم خوب نیست این یک مثالی است از صفحه ثبت نام یاهو کاراکترهای تصادفی که به کاربر نشون داده میشه -W,A.I,T-است که به معنی منظر باش میباشد اما بخش خوب این پیام اینه که بعد 20 دقیقه کمک یاهو فعال میشه
[Help! I've been waiting for over 20 minutes and nothing happens.]
متن:کمک کنید من 20 دقیقه است که منتظرم ولی اتفاقی نمی افتد
(Laughter)
خنده حضار
This person thought they needed to wait. This, of course, is not as bad as this poor person.
این شخص فکر میکنه که باید منتظر باشه البته این یکی به بدی این شخص بیچاره هم نیست
(Laughter)
خنده حضار
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago, and it's been used everywhere. Let me now tell you about a project that we did a few years later, which is sort of the next evolution of CAPTCHA. This is a project that we call reCAPTCHA, which is something that we started here at Carnegie Mellon, then we turned it into a start-up company. And then about a year and a half ago, Google actually acquired this company.
پروژه کپچا چیری است که ما انجام میدهیم در کارنگی میلون در این 10 سال گذشته و این استفاده میشود در همه جا حالا اجازه بدید در مورد پروژه ای بگم که در چند سال گذشته شروع کردیم که نوعی از انقلاب در کپچا به حساب می اید این پروزه به اسم ری کپچای است که ما در کارنگی ملون شروع کرده اییم وسپس آن را به عنوان یک شرکت شروع کردیم و حدود یکسال ونیم گذشته شرکت گوگل مالک آن شد
Let me tell you what this project started. This project started from the following realization: It turns out that approximately 200 million CAPTCHAs are typed everyday by people around the world. When I first heard this, I was quite proud of myself. I thought, look at the impact my research has had. But then I started feeling bad. Here's the thing: each time you type a CAPTCHA, essentially, you waste 10 seconds of your time. And if you multiply that by 200 million, you get that humanity is wasting about 500,000 hours every day typing these annoying CAPTCHAs.
حالا به من اجاز بدهید این پروژه چگونه شروع شد این پروژه از تحقیق زیر شروع شد به نظر میرسه که حدود 200 میلویون کپچا داشته باشیم که روزانه توسط مردم نوشته میشوند زمانی که من این رو شنیدم ، به خودم افتخار کردم من فکر کردم ،به تاثیر تحقیقات من نگاه کن اما بعد احساس بدی داشتم به این نگاه کن ، هر زمان که شما یک کپچا رو مینویسید حداقل 10 ثانیه زمان صرف میکنید و اگه شما اونو ضرب در 200 میلیون کنید 500000 ساعت نفر در روز زمان از دست رفته داریم تایپ این کپچای آزار دهنده است
(Laughter)
بنابر این من حس خوبی نداشتم
So then I started feeling bad.
خنده حضار
(Laughter)
و من شروع به فکر کردن کردم ، خوب ، البته ، ما نمیتونیم از شر کپچا خلاص شویم
And then I started thinking, of course, we can't just get rid of CAPTCHAs, because the security of the web depends on them. But then I started thinking, can we use this effort for something that is good for humanity? So see, here's the thing. While you're typing a CAPTCHA, during those 10 seconds, your brain is doing something amazing. Your brain is doing something that computers cannot yet do. So can we get you to do useful work for those 10 seconds? Is there some humongous problem that we cannot yet get computers to solve, yet we can split into tiny 10-second chunks such that each time somebody solves a CAPTCHA, they solve a little bit of this problem? And the answer to that is "yes," and this is what we're doing now.
برای اینکه امنیت بخشی از وب سایت به او نبستگی داره اما سپس شروع به فکر کردن کردم ، آیا راهی وجود داره که بتونیم از این حرکت استفاده کنیم چیری که برای بشریت مفید باشد ؟ پس ببینید این اون چیز است زمانی که شما یک فایل کپچا رو مینویسید در زمان 10 ثانیه مغز شما کار جالبی انجام میده مغز شما کاری رو انجام میده که هنوز هیچ رایانه ای قادر به انجام اون نیست پس ما کاری میکنیم که درون این 10 ثانیه کار مفیدی انجام بشه چیزی که قرار دادیم مشکل بسیار بزرگی است که هنوز هیچ رایانه ای قادر به حل مشکل نشده ما میتونیم 10 ثانیه رو به دوقسمت تقسیم کنیم زمانی که هر شخص زمانی رو برای حل کپچا انجام میده آنها درارند بخشی از این مشکل رو حل میکنند و جواب اون ، بله است ، واین چیزی است که ما داریم انجام میدهیم
Nowadays, while you're typing a CAPTCHA, not only are you authenticating yourself as a human, but in addition you're helping us to digitize books. Let me explain how this works. There's a lot of projects trying to digitize books. Google has one. The Internet Archive has one. Amazon, with the Kindle, is trying to digitize books. Basically, the way this works is you start with an old book. You've seen those things, right? Like a book?
بنابر این اون چیزی که ممکنه شما تا حالا ندونید اینه که زمانی که شما کپچا رو مینویسید فقط شما خودتون رو به عنوان یک انسان معرفی نمیکنید بلکه شما کمک میکنید تا ما کتابها رو الکترونیکی کنیم اجازه بدبد توضیح بدم تا حالا پروژه های زیادی وجود داشته که جهت الکترونیکی کردن کتابها بوده گوگل یکی از اونها بود.بایگانی اینترنتی یکی دیگر آمازو ن با کیندل(kindle) سعی در الکترونیکی کردن کتابها داره اساسا راهی که این ،کار میکنه اینکه شما با یک کتاب قدیمی شروع میکنید شما اونو دیدید ، درسته ؟ شبیه یه کتاب قدیمی خنده حضار
(Laughter)
بنابر این شما با یک کتاب شروع میکنید ،و شما اونو اسکن میکنید
So you start with a book and then you scan it.
حالا شروع به اسکن کتاب کنید
Now, scanning a book is like taking a digital photograph of every page. It gives you an image for every page. This is an image with text for every page of the book. The next step in the process is that the computer needs to be able to decipher the words in this image. That's using a technology called OCR, for optical character recognition, which takes a picture of text and tries to figure out what text is in there. Now, the problem is that OCR is not perfect. Especially for older books where the ink has faded and the pages have turned yellow, OCR cannot recognize a lot of the words. For things that were written more than 50 years ago, the computer cannot recognize about 30 percent of the words. So now we're taking all of the words that the computer cannot recognize and we're getting people to read them for us while they're typing a CAPTCHA on the Internet.
که شبیه یک عکس دیجیتالی از هر صفحه از کتاب است . اون به شما دیدیگاه میده از هر صفحه از کتاب این یک تصویر از متن هر صفحه از کتابه مرحله بعد پردازش داده ها است که کامپیوتر نیاز داردبه اینکه قادر باشد هر کلمه رو تشخیص بدهد این تکنولوژی رو ocr میگویند جهت تشخیص نوری کاراکترها که از متن عکس گرفته شده است و سعی میکنه شکل متن رو تشخیص بده حالا مشکل اینه که ocr ها عالی عمل نمیکنند خصوصا برای کتابهای قدیمی جایی که جوهر کمرنگ شده و صفحات زرد است ocr نمیتونه خیلی از این کلمات رو تشخیص بدهد برای مثال، برای چیزی که ما 50 سال گذشته نوشتیم کامپیوتر نمی تونه 30 درصد اونارو تشخیص بدهد پس ما باید چکار کنیم آیا غیر از اینه که ما میتونیم کلماتی رو تشخیص بدیم که کامپیوتر نمیتونه و ما از انسانها استفاده میکنیم تا انها رو برای ما بخونن زمانی که اونها یک فایل کپچا رو در اینترنت مینویسن.
So the next time you type a CAPTCHA, these words that you're typing are actually words from books that are being digitized that the computer could not recognize. The reason we have two words nowadays instead of one is because one of the words is a word that the system just got out of a book, it didn't know what it was and it's going to present it to you. But since it doesn't know the answer, it cannot grade it. So we give you another word, for which the system does know the answer. We don't tell you which one's which and we say, please type both. And if you type the correct word for the one for which the system knows the answer, it assumes you are human and it also gets some confidence that you typed the other word correctly. And if we repeat this process to 10 different people and they agree on what the new word is, then we get one more word digitized accurately.
پس زمانی که شما یک فایل کپچا رو مینویسید ، این کلمه که شما مینویسید واقعا بخشی از یک کتاب هستند که در حال الکترونیکی شدن هستند و کامپیوترها هم قادر به تشخیص اون نیستند و دلیل اینکه ما دو کلمه رو کنار هم به جای یک کلمه قرار میدیم اینکه ، همانطور که میبینید ، یک کلمه کلمه ای است که کامپیوتر از کتاب بدست آورده اون نمیدونه که کلمه چیه و اون و به شما ارائه کرده اما زمانی که اون جواب رو نمیدونه ، نمیتونه به شما امتیاز بده پس ما یک کلمه دیگر رو در اختیار شما قرار میدیم کلمه ای که سیستم جواب اونو میدونه ما به شما نمیگیم که این کلمه دوم کدومه ، م میگیم ، لطفا هر دو را بنویسید و زمانی که شما کلمه صحیح رو بنویسید برای کلمه ایی که کامپیوتر جواب اونو میدونه به نظر میرسه که شما یک انسانید همچنین سردرگمی خواهد بود برای کلمه دوم که شما اونو نوشتید و اگه ما اینو برای 10 شخص دیگه بفرستیم و تمامی اونا توافق داشته باشن بر روی اینکه اون کلمه چیست پس ما تونستیم به طور صحیحی یک کتاب رو دیجیتالی کنیم
So this is how the system works. And since we released it about three or four years ago, a lot of websites have started switching from the old CAPTCHA, where people wasted their time, to the new CAPTCHA where people are helping to digitize books. So every time you buy tickets on Ticketmaster, you help to digitize a book. Facebook: Every time you add a friend or poke somebody, you help to digitize a book. Twitter and about 350,000 other sites are all using reCAPTCHA. And the number of sites that are using reCAPTCHA is so high that the number of words we're digitizing per day is really large. It's about 100 million a day, which is the equivalent of about two and a half million books a year. And this is all being done one word at a time by just people typing CAPTCHAs on the Internet.
پس این روشی است که سیستم کار میکنه و به صورت اولیه ، زمانی که ما اونو از سه یا چهار سال پیش عرضه کردیم خیلی از وبسایتها کپچای خودشونو به این سیستم تغییر دادند از کپچایی قدیمی که مردم وقت خودشونو بیهوده صرف میکردند به کپچای جدیدی که مردم کمک میکنند به الکترونیکی کردن کتابها برای مثال سایت فروش بلیط زمانی که شما یک بلیط میخرید کمک میکنید تا یک کتاب دیجیتالی شود فیس بوک:زمانی که شما یک دوستو ادد میکنید یا به دوستتون اشاره میکنید(poke) شما دارید به دیجیتالی کردن یک کتاب کمک میکنید تویتر و حدود 350000 از سایتهای دیگر در حال استفاده ازری کپچا هستند در واقع تعداد سایتهای که از ری کپچا استفاده میکنند بسیار بالاست که تعداد کلملتی که ما در حال دیجیتالی کردن هستیم در هر روز بسیار ، بسیار بالاست چیزی در حدود 100 میلیون در روز که برابر چیزی حدود دو ونیم میلیون کتاب در سال و تمامی این زمانی انجام میشه که یک کلمه نوشته میشه زمانی که مردم یک کپچا رو تایپ میکنن در اینترنت. تشویق حضار
(Applause)
البته
Now, of course, since we're doing so many words per day, funny things can happen. This is especially true because now we're giving people two randomly chosen English words next to each other. So funny things can happen. For example, we presented this word. It's the word "Christians"; there's nothing wrong with it. But if you present it along with another randomly chosen word, bad things can happen. So we get this.
چونکه ما تعداد زیادی از کلمات را هر روز بکار میبریم اتفاق خنده داری میتونه بیوفته. و این درسته زیرا ما به مردم دو انتخاب تصادفی از کلمات نزدیک به هم را در انگلیسی انتخاب میکنیم. خُب اتفاق خنده داری میتونه بیفته. برای مثال ما این دو کلمه رو میدیم کلمه کریستین که مشکلی در اون نیست اما اگه شما یک کلمه تصادفی دیگه رو بدید اتفاق بد خواهد افتاد ما اینو بدست میاریم ، کریستین بد.
[bad Christians]
اما بدتره ، به دلیل اینکه برخی وب سایتها که نشون دادیم
But it's even worse, because the website where we showed this actually happened to be called The Embassy of the Kingdom of God.
اتفاق افتاده به عنوان سفارت شاهان خدایی خنده حضار
(Laughter)
وای
Oops.
خنده حضار
(Laughter)
حالا یه مورد بد دیگه
Here's another really bad one. JohnEdwards.com
JohnEdwards.com لیبرال لعنتی
[Damn liberal]
(Laughter)
خنده حضار
So we keep on insulting people left and right everyday. Of course, we're not just insulting people. Here's the thing. Since we're presenting two randomly chosen words, interesting things can happen. So this actually has given rise to a really big Internet meme that tens of thousands of people have participated in, which is called CAPTCHA art. I'm sure some of you have heard about it. Here's how it works. Imagine you're using the Internet and you see a CAPTCHA that you think is somewhat peculiar, like this CAPTCHA.
پس ما داریم چپ و راست به مردم توهین میکنیم البته ،ما به مردم توهین نمیکنیم اینو ببینید ، زمانی که ما دو حرف تصادفی را انتخاب میکنیم یه چیز جالب اتفاق می افته خُب در واقع این به عنوان یک مشارکت بزرگ در اینترنت که هزاران انسان در آن مشارکت دارند که به عنوان هنر کپچا معروف است، افزایش یافته است من مطمئین هستم برخی از شما در مورد آن شنیده اید بدین صورت کار میکند تصور کنید شما از اینترنت استفاده میکنید و یک کپچا میبینید که فکر میکنید تا حدی عجیب و غریب است مانند این کپچا : توستر نامرئی
[invisible toaster]
بعد شما باید چکار کنید ، آنچه که باید انجام دهید این است که یک تصویر از آن داشته باشید
What you're supposed to do is you take a screenshot of it. Then of course, you fill out the CAPTCHA because you help us digitize a book. But first you take a screenshot and then you draw something that is related to it.
و البته فایل کپچا را پر کنید برای اینکه شما کمک میکنید به ما جهت الکترونیکی کردن کتاب اما سپس ، اول شما یک عکس از آن میگیرید و چیزی را که به اون مرتبط است را رسم میکنید.
(Laughter)
خنده حضار
That's how it works.
که چگونه آن کار میکند
(Laughter)
هزاران مورد از این وجود دارد
There are tens of thousands of these. Some of them are very cute.
برخی از آنها بسیار زیبا هستند متن : اونو گره بزن
[clenched it]
خنده حضار
(Laughter)
برخی هم سرگرم کننده
Some of them are funnier.
بنیانگذاران سنگسار شده
[stoned Founders]
(Laughter)
خنده حضار
And some of them, like paleontological shvisle ...
و برخی ازآنها
(Laughter)
مانندpaleontological shvisle
they contain Snoop Dogg.
حاوی Snoop Dogg هستند
(Laughter)
خنده حضار
OK, so this is my favorite number of reCAPTCHA. So this is the favorite thing that I like about this whole project. This is the number of distinct people that have helped us digitize at least one word out of a book through reCAPTCHA: 750 million, a little over 10 percent of the world's population, has helped us digitize human knowledge. And it is numbers like these that motivate my research agenda. So the question that motivates my research is the following: If you look at humanity's large-scale achievements, these really big things that humanity has gotten together and done historically -- like, for example, building the pyramids of Egypt or the Panama Canal or putting a man on the Moon -- there is a curious fact about them, and it is that they were all done with about the same number of people. It's weird; they were all done with about 100,000 people. And the reason for that is because, before the Internet, coordinating more than 100,000 people, let alone paying them, was essentially impossible. But now with the Internet, I've just shown you a project where we've gotten 750 million people to help us digitize human knowledge. So the question that motivates my research is, if we can put a man on the Moon with 100,000, what can we do with 100 million?
بسیار خوب این عدد مورد علاقه من در باز نویسی کپچاست این چیز مورد علاقه ام در کل پروژه است این تعداد مردم متمایز از هم است که دارند به ما کمک میکنند در الکترونیکی کردن کتابها توسط ری کپچا 750 میلیون انسان چیزی کمی بیشتر از 10 درصد جمعیت جهان که دارند کمک میکنند به ما برای الکترونیکی کردن دانش انسانها و این عددی است که در راس تحقیقات موجب افزایش انگیزه من است سوالی که باعث برانگیختن تحقیق من شده اینه : اگر شما نگاهی به دستاوردهای بشریت در مقیاس بزرگ کنید این دستاوردهای بسیار بزرگ که بشریت با کمک هم و در طول تاریخ بدست آورده اند مانند ساخت اهرام مصر ویا کانال پاناما ویا فرستادن انسان به ماه واقعیت جالبی در مورد آنها وجود دارد و آن این است که تمامی آنها به همان تعداد از انسانها انجام شده خیلی عجیبه ، تمامی آنها توسط 100000 انسان انجام شده و دلیل اون اینکه ، قبل از اینترنت هماهنگی بین بیش از 100000 نفر عملا غیر ممکن بود اما الان با اینترنت ،فقط به شما یه پروژه نشان دادم ما تونستیم از همکاری 750 میلیون انسان استفاده کنیم برای کمک به ما برای الکترونیکی کردن دانش بشر پس سوالی که باعث تحقیقات من شد اینه که اگه ما میتونیم یک انسان رو به کمک 100000 نفر به ماه بفرستیم با 100 میلیون چکاری میتوانیم بکنیم
So based on this question, we've had a lot of different projects that we've been working on. Let me tell you about one that I'm most excited about. This is something that we've been semiquietly working on for the last year and a half or so. It hasn't yet been launched. It's called Duolingo. Since it hasn't been launched, shhh!
پس بر پایه این سوال ما پروژه های زیادی خواهیم داشت که میتوانیم بر روی ان کار کنیم اجازه بدید در باره چیزی حرف بزنم که برام خیلی جالب بود این چیزی است که به صورت نیمه ساکت بر روی آن داریم کار میکنیم برای یک سال و نیم گذشته ویا بیشتر در حال حاضر ارائه نشده،پروژه ای است به نام دولینگو از زمانی که هنوز انتشار نیافته
(Laughter)
خنده حضار
Yeah, I can trust you'll do that. So this is the project. Here's how it started. It started with me posing a question to my graduate student, Severin Hacker. OK, that's Severin Hacker. So I posed the question to my graduate student. By the way, you did hear me correctly; his last name is Hacker.
بله من مطمئن هستم که شما میتونید اونو انجام بدید و این اون پروژه است ،و توضیح خواهم داد شروع شد با طرح سوال به دانشجوی کارشناسی ارشدم استیو هاکر Severin Hacker بسیار خوب سوالم را به استیو هکر فرستادم. بسیار خوب سوالم را به استیو هکر فرستادم. ضمنا ، شما به حرف اسمی که گفتم توجه کردید فامیلیش هکر بود
(Laughter)
این سوالو برای اون ارسال کردم
So I posed this question to him: How can we get 100 million people translating the web into every major language for free? There's a lot of things to say about this question. First of all, translating the web. Right now, the web is partitioned into multiple languages. A large fraction of it is in English. If you don't know English, you can't access it. But there's large fractions in other different languages, and if you don't know them, you can't access it. So I would like to translate all of the web, or at least most of it, into every major language. That's what I would like to do.
ما چطوری میتونیم به 100 میلیون انسان دسترسی داشته باشیم ترجمه وب به مهمترین زبانها به صورت رایگان بسیار خوب ، چیزای زیادی وجود داره که در باره این سوال میشه گفت اول همه ، ترجمه وب همین الان بخشهای وب تقسیم شده به چندین زبان بخش بزرگی از اون به زبان انگلیسی است اگه شما انگلیسی ندونید نمیتونید به او ن دسترسی پیدا کنید اما بخش بزرگی نیز به سایر زبانها اختصاص داره اگه شما اون زبانها روندونید شما هم نمیتونید به اونها دسترسی داشته باشید بنابراین من دوست دارم تمامی وب رو ترجمه کنم ، یا حداقل بخشی از اونو به هر یک از زبانهای مهم پس چه کاری من باید انجام بدم
Now, some of you may say, why can't we use computers to translate? Machine translation is starting to translate some sentences here and there. Why can't we use it to translate the web? The problem with that is it's not yet good enough and it probably won't be for the next 15 to 20 years. It makes a lot of mistakes. Even when it doesn't, since it makes so many mistakes, you don't know whether to trust it or not.
ممکنه خیلی از شما بگید چرا از مترجم کامپیوتری استفاده نکنیم؟ چرا ما از ترجمه ماشینی استفاده نکنیم ؟ ترجمه ماشینی یک ترجمه جسته و گریخته است چرا ما نمیتونیم از اون برای ترجمه تمامی صفحات وب استفاده کنیم ؟ مشکل اینه که به اندازه کافی برای ترجمه وب مناسب نیستن و احتمالان هم برای 15 تا 20 سال آینده استفاده نخواهند شد اون خیلی مشکلات داره زمانی که مشکلی کوچک ایجاد میشه تا مشکلات بزرگ، شما نمیدونید که آیا باید به اون اطمینان کنید یا نه
So let me show you an example of something that was translated with a machine. Actually, it was a forum post. It was somebody who was trying to ask a question about JavaScript. It was translated from Japanese into English. So I'll just let you read. This person starts apologizing for the fact that it's translated with a computer. So the next sentence is going to be the preamble to the question. So he's just explaining something. Remember, it's a question about JavaScript.
یه مثالی رای شما بیارم شخصی که در حال ترجمه با یک کامپیوتر است و واقعا پستی بوده که در یکی از فرومهای گفتگو بوده شخصی بود که در مورد جاوا اسکریپت سوالی داشته اون از زبان ژاپنی به انگلیسی ترجمه کرده بود حالا میخوام که بخونید اون شخص عذر خواهی کرده بود برای ترجمه ای که توسط کامپیوتر صورت گرفته بوده وقصد دارم مقدمه ای برای سوال باشه اون فقط چیزی رو توصیف کرده بود به یاد دارید اون سوالی رو در باره جاوا اسکریپت داشته
[At often, the goat-time install a error is vomit.]
متن : اغلب ، خطا در زمان نصب یک بز تحوع آوره
(Laughter)
خنده حظار
Then comes the first part of the question.
حالا به بخش اول سوال میرسیم
[How many times like the wind, a pole, and the dragon?]
چند بار شبیه باد ، قطب و اژدها بوده اید؟
(Laughter)
خنده حضار
Then comes my favorite part of the question.
حالا به بخش مورد علاقه سوالم میرسیم
[This insult to father's stones?]
این توهین به سنگ پدران است ؟
(Laughter)
خنده حضار
And then comes the ending, which is my favorite part of the whole thing.
وبه پایان میرسیم ، که قسمت مورد علاقه من از همه چیز است. متن :لطفا عذرخواهی کن برای احمقیت خودت .تشکرهای زیادی در این حالت وجود دارد.
[Please apologize for your stupidity. There are a many thank you.]
خنده حضار
(Laughter)
بسیار خوب ، ترجمه های ماشینی زیاد خوب نیستن
OK, so computer translation, not yet good enough. So back to the question. So we need people to translate the whole web. So now the next question you may have is, well, why can't we just pay people to do this? We could pay professional translators to translate the whole web. We could do that. Unfortunately, it would be extremely expensive. For example, translating a tiny fraction of the whole web, Wikipedia, into one other language, Spanish. OK? Wikipedia exists in Spanish, but it's very small compared to the size of English. It's about 20 percent of the size of English. If we wanted to translate the other 80 percent into Spanish, it would cost at least 50 million dollars -- and this is even at the most exploited, outsourcing country out there. So it would be very expensive. So what we want to do is, we want to get 100 million people translating the web into every major language for free.
به سوال برمیگردیم ما به مردمی نیاز داریم که همه وب رو ترجمه کنند بنابر این سوال بعدی شما اینه چرا ما نمیتونیم حقوق مردم رو برای اینکار بپردازیم ؟ ما میتونیم به حرفه ایها حقوق بدیم تا همه وب رو ترجمه کنن ما میتونیم اینو انجام بدیم متاسفانه این کار هزینه بالایی داره برای مثال ، ترجمه یه بخش خیلی ،خیلی کوچک از وب یعنی ویکیپدیا به زبان دیگری مثل اسپانیایی که ویکیپدیا به زبان اسپانیای هم وجود دارد خیلی کوچیکه در مقایسه با زبان انگلیسی چیزی در حدود 20 درصد زبان انگلیسی اگه ما بخواهیم ترجمه کنیم 80 درصد دیگه رو به اسپانیایی هزینه اون شامل 50 میلیون دولار خواهد بود و یک حالت استثماری برای برون سپاری کارها در یک کشور دیگه پس هزینش خیلی بالاست پس کار ما اینجا استفاده از همون 100میلیون انسانه برای ترجمه وب به هر زبان مهم دیگه به صورت رایگان
If this is what you want to do, you quickly realize you're going to run into two big hurdles, two big obstacles. The first one is a lack of bilinguals. So I don't even know if there exists 100 million people out there using the web who are bilingual enough to help us translate. That's a big problem. The other problem you're going to run into is a lack of motivation. How are we going to motivate people to actually translate the web for free? Normally, you have to pay people to do this. So how are we going to motivate them to do it for free? When we were starting to think about this, we were blocked by these two things. But then we realized, there's a way to solve both these problems with the same solution. To kill two birds with one stone. And that is to transform language translation into something that millions of people want to do and that also helps with the problem of lack of bilinguals, and that is language education.
حالا اگه این چیزی باشه که میخواهیم انجام بدیم شما خیلی سریع دو مشکل خیلی بزرگ رو شناسایی خواهید کرد دو مشکل بزرگ مشکل اول کمبود اشخاصی است که به دوزبان تسلط داشته باشن خُب حتی من هم نمیدونستم اگر 100 میلیون انسانی که وجود دارند که از وب استفاده میکنند تسلط کامل به دو زبان را دارند که در کار ترجمه به ما کمک کنند این یک مشکل بزرگ است مشکل دوم کمبود انگیزه انجام این کار است چگونه میتوانیم ایجاد انگیزه کنیم تا به صورت رایگان وب را ترجمه کنند به صورت عادی باید هزینه این کار پرداخت شود پس ما چگونه باید این کار رو انجام بدیم زمانی که به این موضوع فکر کردیم به این دومانع برخورد کردیم اما ما فهمیدیم که راحی برای این کار وجود دارد برای حل این دومشکل با یک راه حل راهی که با یک تیر دونشون بزنیم و اون انتقال زبان ترجمه به چیزی است که میلیونها انسان میخواهند آن را نجام دهند و اون همچنین کمک میکنه به کمبود دوزبانه ها و اون آموزش زبانه
So it turns out that today, there are over 1.2 billion people learning a foreign language. People really want to learn a foreign language. And it's not just because they're being forced to do so in school. In the US alone, there are over five million people who have paid over $500 for software to learn a new language. So people really want to learn a new language. So what we've been working on for the last year and a half is a new website -- it's called Duolingo -- where the basic idea is people learn a new language for free while simultaneously translating the web. And so basically, they're learning by doing.
پس به نظر میرسه که امروز چیزی بیش از 1میلیارد و 200 میلیون انسان وجود داره برای یادگیری زبانهای خارجی مردمی که واقعا دوست دارند زبان خارجی رو یاد بگیرند و این فقط به خاطر اینکه آنها مجبور به انجام این کار در مدرسه نیست. برای مثال فقط در امریکا بیش از 5 میلیون نفر وجود دارند که رقمی حدود 500 دلار میپردازند برای نرم افزارهایی برای یادگیری یک زبان جدید خُب مردم واقعا دوست دارند که یه زبان دیگه رو یاد بگیرند بنابراین اون چیزی که ما طی این یک سال و نیم بر روی ان کار میکنیم یک وب سایت است با نام دولینگو Duolingo یک ایده ساده جهت یادگیری رایگان زبان جدید زمانی که همزمان در حال ترجمه هستند توسط کاری که انجام میدهند آموزش هم میبینند
So the way this works is whenever you're a just a beginner, we give you very simple sentences. There's a lot of very simple sentences on the web. We give you very simple sentences along with what each word means. And as you translate them and as you see how other people translate them, you start learning the language. And as you get more advanced, we give you more complex sentences to translate. But at all times, you're learning by doing.
بنابراین راهی که این کار میکند اینکه زمانی که شما یک مبتدی هستید ما به شما جمله های خیلی ، خیلی ساده میدهیم البته مشخصه که خیلی از جمله های ساده موجود بر روی وب ما به شما جملات بسیار ساده ای میدهیم همراه با اینکه هر کلمه به چه معنی است و زمانی که شما اونارو ترجمه میکنید، و شما ترجمه سایرین رو همیبینید شما شروع به یادگیری زبان میکنید و زمانی که شما پیشرفت میکنید ما به شما جملات پیچیده تری میدهیم در تمام اوقات شما در حال یادگیری عملی زبان هستید روش جالب در این روش
Now, the crazy thing about this method is that it actually really works. People are really learning a language. We're mostly done building it and now we're testing it. People really can learn a language with it. And they learn it about as well as the leading language learning software. So people really do learn a language. And not only do they learn it as well, but actually it's more interesting. Because with Duolingo, people are learning with real content. As opposed to learning with made-up sentences, people are learning with real content, which is inherently interesting. So people really do learn a language.
اینه که این روش واقعا جواب میده اول از همه مردم واقعا یه زبان رو یاد میگیرن ما تقریبا ساخت اون رو تموم کردیم،و در حال آزمایش اون هستیم مردم واقعا با اون میتونن زبان رو یاد میگیرن و آنهایک زبان را یاد میگیرند از طریق یک نرم افزار پیشرو در زبان آموزی پس مردم واقعا یک زبان رو یاد میگیرن فقط این نیست که اونا یاد میگیرن بلکه یک کار خیلی جالبه برای اینکه در این وب سایت مردم با محتویات واقعی آموزش میبینند در مقابل متنهایی که ساخته میشوند مردم با محتویات واقعی یاد میگیرند ،که اساسا خیلی جالبه پس مردم واقعا یک زبان رو یاد میگیرن
But perhaps more surprisingly, the translations that we get from people using the site, even though they're just beginners, the translations that we get are as accurate as those of professional language translators, which is very surprising. So let me show you one example. This is a sentence that was translated from German into English. The top is the German. The middle is an English translation that was done by a professional translator who we paid 20 cents a word for this translation. And the bottom is a translation by users of Duolingo, none of whom knew any German before they started using the site. If you can see, it's pretty much perfect. Of course, we play a trick here to make the translations as good as professional language translators. We combine the translations of multiple beginners to get the quality of a single professional translator.
اما شاید بیشتر نکته جالب ترجمه هایی که ما از مردم توسط وب سایت بدست می آوریم حتی اگر آنها مبتدی باشند صحت ترجمه آنها مانند افراد حرفه ای است که خیلی جالب توجه اجازه بدهید یه مثال به شما نشان بدهم این متنی است که از آلمانی به انگلیسی برگردانیده شده است بالایی آلمانی است وسط ترجمه انگلیسی است که توسط یک فرد حرفه ای انگلیسی زبان ترجمه شده است که ما 20 سنت برای ترجمه آن پرداخت کرده ایم و قسمت پائین ترجمه کاربر ما در وب سایت دولینگو Duolingo است هیچ یک از انها المانی نمیانستند قبل از شروع استفاده ازاین وبسایت همانطور که میبینید یک ترجمه کامل است البته ما یک ترفند بکار برده ایم برای انجام اینکه ترجمه ها به خوبی یک فرد حرفه ایی باشد ما ترجمه های چند مبتدی رو با هم ترکیب کردیم برای اینکه کیفیت یک مترجم حرفه ای رو بدست بیاوریم
Now, even though we're combining the translations, the site actually can translate pretty fast. So let me show you, this is our estimates of how fast we could translate Wikipedia from English into Spanish. Remember, this is 50 million dollars' worth of value. So if we wanted to translate Wikipedia into Spanish, we could do it in five weeks with 100,000 active users. And we could do it in about 80 hours with a million active users. Since all the projects my group has worked on so far have gotten millions of users, we're hopeful that we'll be able to translate extremely fast.
حالا هر موقع که ما ترجمه ها رو ترکیب میکنیم سایت واقعا میتونه سریع یک ترجمه رو انجام بدهد حالا اجازه بدهید به شما چیزی را نشان بدم این تخمین ماست که چقدر سریع میتونیم یه سایت مثل ویکیپدیا رو ترجمه کنیم از انگلیسی به اسپانیایی به یاد داشته باشید ارزش این کار 50 میلیون دلار بود پس اگر ما بخواهیم ویکیپدیا رو به اسپانیایی ترجمه کنیم ما میتونیم این کارو توسط100000کاربر فعال و طی 5 هفته انجام بدیم وما میتونیم این کارو توسط یک میلیون کاربر ظرف 80 ساعت انجام بدهیم از زمانی که پروژه رو شروع کردیم گروه ما چیزی در حدود یک میلیون کاربر را ثبت نام کرده است ما امیدواریم که ما توانایی ترجمه خیلی سریع با این پروژه را داشته باشیم
Now, the thing that I'm most excited about with Duolingo is I think this provides a fair business model for language education. So here's the thing: The current business model for language education is the student pays, and in particular, the student pays Rosetta Stone 500 dollars.
حالا چیزی که در دولینگو Duolingo مرا هیجان زده میکند من فکر می کنم این مدل کسب و کار عادلانه ایی را برای آموزش زبان فراهم می کند و اون اینه مدلهای فعلی بتجاری رای آموزش زبان بر پایه پرداخت هزینه توسط دانشجو است . خصوصا ، دانشجویان برای Rosetta Stone(شرکت آموزش زبان) 500 دلار پرداخت میکنند
(Laughter)
خنده حضار
That's the current business model. The problem with this business model is that 95 percent of the world's population doesn't have 500 dollars. So it's extremely unfair towards the poor. This is totally biased towards the rich. Now, see, in Duolingo, because while you learn, you're actually creating value, you're translating stuff -- which, for example, we could charge somebody for translations, so this is how we could monetize this. Since people are creating value while they're learning, they don't have to pay with their money, they pay with their time. But the magical thing here is that is time that would have had to have been spent anyways learning the language. So the nice thing about Duolingo is, I think, it provides a fair business model -- one that doesn't discriminate against poor people.
این مدل تجاری فعلی است مشکل مدل تجاری فعلی اینه که 90 درصد جمعیت جهان 500 دلار ندارند پس این در مورد افراد بی پول کاملا غیر عادلانه است این سیستم بر پایه افراد ثروتمند است میبینیم که در وب سایت دولینگو ما برای اینکه شما یاد میگیرید شما واقعا ایجاد ارزش میکنید شما چیزهای مختلفی رو ترجمه میکنید که برای مثال ما میتونیم پرداختی داشته باشیم برای ترجمه های یک شخص پس این چیزی است که ما میتونیم پولی کنیم زمانی که مردم ایجاد ارزش میکنند در حین اینکه آموزش زبان میبینند اونا با پول پرداخت نمیکنند بلکه از طریق صرف زمان هزینه رو پرداخت میکنند کار جادوی در اینجا پرداخت هزینه با صرف زمان است به هر حال زمانی که در اینجا صرف میشه یادگیری زبان است پس اتفاق خوب در مورد وب سایت دولینگو اینه که یک مدل تجاری عادلانه رو ایجاد میکنه که در مورد مردم فقیر تبعیض قائل نیست و این وب سایت ما است .با تشکر
So here's the site. Thank you.
تشویق حضار
(Applause)
اینم وب سایت
We haven't yet launched, but if you go there, you can sign up to be part of our private beta, which is probably going to start in three or four weeks. We haven't yet launched it.
ما هنوز اونو منتشر نکردیم اما اگه شما به این وب سایت مراجعه کنید میتونید به عنوان کاربر آزمایشی ثبت نام کنید که احتمالا ظرف یهیا چهار هفته آینده شروع به کار میکنه ما هنوز سایت دولینگو را منتشر نکردیم
By the way, I'm the one talking here, but Duolingo is the work of a really awesome team,
اما به هر حال من اولین کسی هستم که در مورد اون صحبت میکنه اما حقیقتا یک تیم کاملا خبره بر روی دولینگو کار میکنه که برخی از اونها هم اینجا هستن
some of whom are here. So thank you.
از شما سپاس گذارم.
(Applause)
تشویق حضار