How many of you had to fill out a web form where you've been asked to read a distorted sequence of characters like this? How many of you found it really annoying?
Скільком з вас доводилось заповнювати веб-форми, де треба було прочитати спотворену послідовність символів, на зразок цієї? І скільком з вас це здавалось дійсно дратівливим? Добре, чудово. Насправді, я винайшов це.
(Laughter)
OK, outstanding. So I invented that.
(Сміх)
(Laughter)
Точніше, я був одним з тих, хто зробив це.
Or I was one of the people who did it. That thing is called a CAPTCHA. And it is there to make sure you, the entity filling out the form, are a human and not a computer program that was written to submit the form millions of times. The reason it works is because humans, at least non-visually-impaired humans, have no trouble reading these distorted characters, whereas programs can't do it as well yet. In the case of Ticketmaster, the reason you have to type these characters is to prevent scalpers from writing a program that can buy millions of tickets, two at a time.
Ця річ називається CAPTCHA. І її головна мета полягає в том, щоб впевнитись, що той, хто заповнює форму, є дійсно людиною, а не комп'ютерною програмою, яка була створена, щоб заповнювати форму мільйони й мільйони разів. Принцип, за яким вона працює, полягає в тому, що люди, принаймні зрячі люди, не мають проблем з прочитанням цих пошкоджених символів, натомість комп'ютерні програми просто не можуть все ще робити це добре. Тож, наприклад, у випадку з Ticketmaster, причина за якою вам необхідно вводити ці покручені символи в тому, щоб запобігти спекулянтам писати програми, які можуть купувати мільйони квитків за раз.
CAPTCHAs are used all over the Internet. And since they're used so often, a lot of times the sequence of random characters shown to the user is not so fortunate. So this is an example from the Yahoo registration page. The random characters that happened to be shown to the user were W, A, I, T, which, of course, spell a word. But the best part is the message that the Yahoo help desk got about 20 minutes later.
CAPTCHA використовується скрізь в Інтернеті. І через те, що вони використовуються так часто, точні послідовності довільних символів, які бачить користувач, бувають не дуже вдалими. Це приклад зі сторінки реєстрації Yahoo. Довільні символи, які були показані користувачу: W, A, I, T, які дійсно звелись до слова (англ. "чекайте"). Але найкраща частина -- це повідомлення, яке служба підтримки Yahoo отримала 20 хвилин по тому.
[Help! I've been waiting for over 20 minutes and nothing happens.]
Повідомлення: "Допоможіть! Я чекав понад 20 хвилин і нічого не відбулось".
(Laughter)
(Сміх)
This person thought they needed to wait. This, of course, is not as bad as this poor person.
Ця людина подумала, що треба зачекати. Це звісно не так погано, як у цьому випадку.
(Laughter)
(Сміх)
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago, and it's been used everywhere. Let me now tell you about a project that we did a few years later, which is sort of the next evolution of CAPTCHA. This is a project that we call reCAPTCHA, which is something that we started here at Carnegie Mellon, then we turned it into a start-up company. And then about a year and a half ago, Google actually acquired this company.
Проект CAPTCHA - це те, що ми зробили тут в Університеті Карнегі-Мелон понад 10 років тому, і він використовується усюди. Дозвольте тепер розповісти про проект, який ми зробили декілька років по тому. Це певний крок в еволюції CAPTCHA. Це проект, який ми назвали reCAPTCHA, що ми також розпочали тут у Карнегі-Мелон, а потім перетворили у стартап-компанію. Потім десь через півтора року Google придбав цю компанію.
Let me tell you what this project started. This project started from the following realization: It turns out that approximately 200 million CAPTCHAs are typed everyday by people around the world. When I first heard this, I was quite proud of myself. I thought, look at the impact my research has had. But then I started feeling bad. Here's the thing: each time you type a CAPTCHA, essentially, you waste 10 seconds of your time. And if you multiply that by 200 million, you get that humanity is wasting about 500,000 hours every day typing these annoying CAPTCHAs.
Тож дозвольте розповісти про цей проект. Цей проект розпочався з наступного усвідомлення. З'ясувалось, що приблизно 200 мільйонів CAPTCHA кодів щодня вводяться людьми по всьому світу. Коли я вперше почув це, я дуже пишався собою. Я думав про вплив, який зробили мої дослідження. Але невдовзі став почуватись гірше Справа в тому, що кожен раз, коли ви вводите CAPTCHA, ви витрачаєте приблизно 10 секунд вашого життя. І, якщо помножити це на 200 мільйонів, то виявиться, що людство витрачає приблизно 500 000 годин щодня, заповнюючи ці дратівливі CAPTCHA коди.
(Laughter)
Тож я почувався пригніченим.
So then I started feeling bad.
(Сміх)
(Laughter)
Потім я почав думати: добре, ми не можемо просто позбутись CAPTCHA,
And then I started thinking, of course, we can't just get rid of CAPTCHAs, because the security of the web depends on them. But then I started thinking, can we use this effort for something that is good for humanity? So see, here's the thing. While you're typing a CAPTCHA, during those 10 seconds, your brain is doing something amazing. Your brain is doing something that computers cannot yet do. So can we get you to do useful work for those 10 seconds? Is there some humongous problem that we cannot yet get computers to solve, yet we can split into tiny 10-second chunks such that each time somebody solves a CAPTCHA, they solve a little bit of this problem? And the answer to that is "yes," and this is what we're doing now.
адже безпека Веб залежить від них. Але потім я почав розмірковувати, чи існує шлях, коли ми зможемо використати це для чогось корисного людям? Тож, ось в чому справа. Коли ви вводите CAPTCHA код, упродовж 10 секунд ваш мозок робить щось дивовижне. Ваш мозок робить щось, що комп'ютери не можуть досі зробити. Чи можемо ми дати вам корисну роботу протягом цих 10 секунд? Іншими словами, чи є якась гомогенна проблема, яку комп'ютери ще досі не вміють розв'язувати, але яку б ми могли розбити на маленькі 10-секундні порції, таким чином, що коли хтось вводить CAPTCHA, він розв'язує невеликий шматок цієї проблеми? І відповідь на це: "так". І це те, що ми зараз робимо.
Nowadays, while you're typing a CAPTCHA, not only are you authenticating yourself as a human, but in addition you're helping us to digitize books. Let me explain how this works. There's a lot of projects trying to digitize books. Google has one. The Internet Archive has one. Amazon, with the Kindle, is trying to digitize books. Basically, the way this works is you start with an old book. You've seen those things, right? Like a book?
Тож, можливо ви не знаєте, але сьогодні, коли ви вводите CAPTCHA, ви не тільки підтверджуєте, що ви насправді людина, але й додатково допомагаєте нам оцифровувати книги. Дозвольте пояснити, як це працює. Існує багато проектів, які намагаються оцифровувати книги. Google має такий. Інший є в Internet Archive. Зараз Amazon з Kindle намагаються оцифровувати книги. В двох словах це працює так: ви берете стару книгу. Ви бачили ці штуки, так? Книги? (Сміх)
(Laughter)
Тож ви берете книгу і потім скануєте її.
So you start with a book and then you scan it.
Сканування книги --
Now, scanning a book is like taking a digital photograph of every page. It gives you an image for every page. This is an image with text for every page of the book. The next step in the process is that the computer needs to be able to decipher the words in this image. That's using a technology called OCR, for optical character recognition, which takes a picture of text and tries to figure out what text is in there. Now, the problem is that OCR is not perfect. Especially for older books where the ink has faded and the pages have turned yellow, OCR cannot recognize a lot of the words. For things that were written more than 50 years ago, the computer cannot recognize about 30 percent of the words. So now we're taking all of the words that the computer cannot recognize and we're getting people to read them for us while they're typing a CAPTCHA on the Internet.
це як зробити цифрові фотографії кожної сторінки книги. Це дає вам зображення кожної сторінки книги. Це зображення з текстом кожної сторінки книги. Наступний крок в процесі -- комп'ютер повинен розшифрувати всі ці слова на зображенні. Тут використовується технологія ОРС, оптичного розпізнавання символів, яка бере зображення тексту і намагається зрозуміти, що ж за текст там представлений. Проблема в тому, що ОРС не є досконалою. Особливо для старих книг, де чорнила потьмяніли, а сторінки пожовтіли. ОРС не може розпізнавати багато слів. Наприклад, для речей, які були написані більше 50 років тому, комп'ютер не може розпізнати приблизно 30 відсотків слів. Те, що ми робимо зараз -- це ми беремо всі ці слова, які комп'ютер не зміг розпізнати і даємо їх людям, щоб ті змогли їх прочитати для нас в той час, коли вводять CAPTCHA в мережі.
So the next time you type a CAPTCHA, these words that you're typing are actually words from books that are being digitized that the computer could not recognize. The reason we have two words nowadays instead of one is because one of the words is a word that the system just got out of a book, it didn't know what it was and it's going to present it to you. But since it doesn't know the answer, it cannot grade it. So we give you another word, for which the system does know the answer. We don't tell you which one's which and we say, please type both. And if you type the correct word for the one for which the system knows the answer, it assumes you are human and it also gets some confidence that you typed the other word correctly. And if we repeat this process to 10 different people and they agree on what the new word is, then we get one more word digitized accurately.
Тож наступного разу, коли ви вводите CAPTCHA, ці слова, що вводите, насправді походять з книг, які оцифровуються, що комп'ютер не зміг розпізнати. І причина, чому зараз ми маємо два слова замість одного, полягає в тому, що одне з цих слів -- це слово, яке система щойно взяла з книги та не знає що це за слово, тож вона надає його вам. Але через те, що вона не знає правильної відповіді, вона не може оцінити вашу відповідь. Тож ми даємо інше слово, щодо якого система знає правильну відповідь. Ми не кажемо вам яке з них відоме. Ми просто просимо ввести обидва. І якщо ви вводите правильно слово, яке вже відомо системі, вона вважає вас за людину. А також вона отримає деяку впевненість, що ви правильно ввели інше слово. Якщо ми повторимо цей процес з 10 різними людьми і всі вони погодяться щодо нового слова, тоді ми отримуємо одне нове правильно оцифроване слово.
So this is how the system works. And since we released it about three or four years ago, a lot of websites have started switching from the old CAPTCHA, where people wasted their time, to the new CAPTCHA where people are helping to digitize books. So every time you buy tickets on Ticketmaster, you help to digitize a book. Facebook: Every time you add a friend or poke somebody, you help to digitize a book. Twitter and about 350,000 other sites are all using reCAPTCHA. And the number of sites that are using reCAPTCHA is so high that the number of words we're digitizing per day is really large. It's about 100 million a day, which is the equivalent of about two and a half million books a year. And this is all being done one word at a time by just people typing CAPTCHAs on the Internet.
Тож таким чином ця система працює. Ми запустили її приблизно три-чотири роки тому і багато веб сайтів перейшли зі старої CAPTCHA, де люди просто марнували свій час, до нового CAPTCHA, де люди допомагають оцифровувати книги. Як, наприклад, Ticketmaster. Кожного разу купуючи квиток на Ticketmaster, ви допомагаєте оцифровувати книги. Фейсбук: кожного разу, коли додаєте друга або видаляєте когось, ви допомагаєте оцифровувати книги. Твітер та приблизно 350 000 інших сайтів використовують reCAPTCHA. І насправді, кількість сайтів, які використовують reCAPTCHA настільки велика, що кількість слів, які ми оцифровуємо щодня дійсно дуже-дуже велика. Приблизно 100 мільйонів щодня, що відповідає приблизно 2,5 мільйонам книг на рік. І це все робиться завдяки одному слову за раз людьми, які просто вводять CAPTCHA в мережі. (Аплодисменти)
(Applause)
Тепер, звісно,
Now, of course, since we're doing so many words per day, funny things can happen. This is especially true because now we're giving people two randomly chosen English words next to each other. So funny things can happen. For example, we presented this word. It's the word "Christians"; there's nothing wrong with it. But if you present it along with another randomly chosen word, bad things can happen. So we get this.
коли ми робимо стільки слів щодня, можуть відбуватись різні кумедні речі. І це справедливо, тому що ми даємо людям два випадкових англійських слова, які розташовані поруч. Тож з'являються кумедні речі. Наприклад, ми дали це слово. Це слово "Християни"; з ним немає нічого особливого. Але якщо представити його з іншим випадково обраним словом, можуть трапитись погані речі. Тож ми отримали це. (Текст: Погані християни)
[bad Christians]
Найгірше те, що ми показали це на веб сайті,
But it's even worse, because the website where we showed this actually happened to be called The Embassy of the Kingdom of God.
який називався "Посольство Королівства Бога". (Сміх)
(Laughter)
Ой.
Oops.
(Сміх)
(Laughter)
Ось ще одне невдале.
Here's another really bad one. JohnEdwards.com
JohnEdwards.com (сайт сенатора-демократа у США) (Текст: Кляті ліберали)
[Damn liberal]
(Laughter)
(Сміх)
So we keep on insulting people left and right everyday. Of course, we're not just insulting people. Here's the thing. Since we're presenting two randomly chosen words, interesting things can happen. So this actually has given rise to a really big Internet meme that tens of thousands of people have participated in, which is called CAPTCHA art. I'm sure some of you have heard about it. Here's how it works. Imagine you're using the Internet and you see a CAPTCHA that you think is somewhat peculiar, like this CAPTCHA.
Тож ми продовжуємо обурювати людей щодня. Звісно, ми не тільки обурюємо людей. Через те, що ми представляємо два випадково обраних слова, можуть траплятись цікаві речі. І це перетворилось на дійсно великий Інтернет мем, в якому приймають участь десятки тисяч людей, що називається "Мистецтво CAPTCHA". Я не певен, що ви чули про нього. Ось як він працює. Уявіть собі, що ви використовуєте Інтернет і ви бачите CAPTCHA, яке вам здається достатньо своєрідним, як це. (Текст: невидимий тостер).
[invisible toaster]
Вам лишається зробити екранну копію цього CAPTCHA.
What you're supposed to do is you take a screenshot of it. Then of course, you fill out the CAPTCHA because you help us digitize a book. But first you take a screenshot and then you draw something that is related to it.
Звісно, потім вам потрібно його заповнити, адже ви допомагаєте нам оцифровувати книги. Але перед цим ви спочатку робите екранну копію, а потім малюєте щось пов'язане з нею.
(Laughter)
(Сміх)
That's how it works.
Так воно працює.
(Laughter)
І таких десятки тисяч.
There are tens of thousands of these. Some of them are very cute.
Деякі з них дуже дотепні (Текст: стисни його).
[clenched it]
(Сміх)
(Laughter)
Деякі навіть смішніші.
Some of them are funnier.
(Текст: скам'янілі засновники)
[stoned Founders]
(Laughter)
(Сміх)
And some of them, like paleontological shvisle ...
А деякі з них,
(Laughter)
як палеонтологічний швісл (сленг: "палеонтологічний, полюбому"),
they contain Snoop Dogg.
містять Снуп Догга.
(Laughter)
(Сміх)
OK, so this is my favorite number of reCAPTCHA. So this is the favorite thing that I like about this whole project. This is the number of distinct people that have helped us digitize at least one word out of a book through reCAPTCHA: 750 million, a little over 10 percent of the world's population, has helped us digitize human knowledge. And it is numbers like these that motivate my research agenda. So the question that motivates my research is the following: If you look at humanity's large-scale achievements, these really big things that humanity has gotten together and done historically -- like, for example, building the pyramids of Egypt or the Panama Canal or putting a man on the Moon -- there is a curious fact about them, and it is that they were all done with about the same number of people. It's weird; they were all done with about 100,000 people. And the reason for that is because, before the Internet, coordinating more than 100,000 people, let alone paying them, was essentially impossible. But now with the Internet, I've just shown you a project where we've gotten 750 million people to help us digitize human knowledge. So the question that motivates my research is, if we can put a man on the Moon with 100,000, what can we do with 100 million?
Добре, це моє улюблене число reCAPTCHA. Це моя улюблена річ, яка пов'язана з усім проектом. Це кількість різних людей, які допомогли нам оцифровувати хоча б одне слово за допомогою reCAPTCHA: 750 мільйонів, що трохи більше за 10 відсотків населення світу, допомогли нам оцифрувати знання людства. І подібні числа мотивують мою дослідницьку роботу. Питання, яке мотивує мої дослідження, наступне. Якщо ви подивитесь на великі досягнення людства, на ці дійсно великі речі, які люди робили разом протягом історії -- наприклад, будівництво єгипетських пирамід або панамського каналу, або політ людини на Місяць -- з ними пов'язаний цікавий факт. Всі вони створювались приблизно однаковою кількістю людей. Це приголомшує. Всі вони були здійснені за участю приблизно 100 000 людей. І причина в тому, що до існування Інтернету, зібрати та скоординувати більше 100 000 людей, а тим паче заплатити їм, було практично неможливо. Але зараз, завдяки Інтернету я щойно показав вам проект, в якому ми зібрали 750 мільйонів людей, щоб допомогти оцифрувати знання людства. Питання, яке мотивує мої дослідження: якщо ми можемо запустити людину на Місяць за допомогою 100 000, що ми можемо зробити із 100 мільйонами?
So based on this question, we've had a lot of different projects that we've been working on. Let me tell you about one that I'm most excited about. This is something that we've been semiquietly working on for the last year and a half or so. It hasn't yet been launched. It's called Duolingo. Since it hasn't been launched, shhh!
Ґрунтуючись на цьому питанні, ми зробили багато різних проектів. Дозвольте розповісти про один з найбільш цікавих, як на мене. Це те, над чим ми тихенько працюємо десь приблизно останні півтора роки. Він ще на запущений. Називається проект -- Duolingo. Через те, що він не запущений, -- шшшш!
(Laughter)
(Сміх)
Yeah, I can trust you'll do that. So this is the project. Here's how it started. It started with me posing a question to my graduate student, Severin Hacker. OK, that's Severin Hacker. So I posed the question to my graduate student. By the way, you did hear me correctly; his last name is Hacker.
Так, я можу вам в цьому довіритись. Тож, так цей проект розпочався. Він почався з мого запитання до одного з моїх випускників. Северін Хакер. Добре, це Северін Хакер. Тож, я поставив йому запитання. Між іншим, ви правильно мене почули: його прізвище Хакер.
(Laughter)
Я поставив йому питання:
So I posed this question to him: How can we get 100 million people translating the web into every major language for free? There's a lot of things to say about this question. First of all, translating the web. Right now, the web is partitioned into multiple languages. A large fraction of it is in English. If you don't know English, you can't access it. But there's large fractions in other different languages, and if you don't know them, you can't access it. So I would like to translate all of the web, or at least most of it, into every major language. That's what I would like to do.
як ми можемо залучити 100 мільйонів людей безкоштовно перекласти увесь Веб на всі основні мови? Добре, тут є багато про що поговорити. По-перше, переклад Вебу. Зараз Веб поділений на багато мов. Велика частина його -- англійською. Якщо ви не знаєте англійської, ви не маєте до неї доступ. Але також існують великі частини на інших мовах, і якщо ви не знаєте цих мов, то ви не маєте доступу до них. Тож я хотів би перекласти увесь Веб, або хоча б його більшу частину на всі основні мови. Це те що я хотів би зробити.
Now, some of you may say, why can't we use computers to translate? Machine translation is starting to translate some sentences here and there. Why can't we use it to translate the web? The problem with that is it's not yet good enough and it probably won't be for the next 15 to 20 years. It makes a lot of mistakes. Even when it doesn't, since it makes so many mistakes, you don't know whether to trust it or not.
Дехто з вас може спитати: чому не використати комп'ютерні перекладачі? Чому не можна використати автоматичний переклад? Автоматичний переклад наразі використовується у різних галузях. Чому не можна використати його для перекладу всього Вебу? Проблема тут полягає в тому, що він не достатньо якісний і, можливо, буде лишатись таким найближчі 15-20 років. Він робить багато помилок. Навіть коли він не робить помилок, через те, що він робить багато помилок, ви не знаєте довіряти йому чи ні.
So let me show you an example of something that was translated with a machine. Actually, it was a forum post. It was somebody who was trying to ask a question about JavaScript. It was translated from Japanese into English. So I'll just let you read. This person starts apologizing for the fact that it's translated with a computer. So the next sentence is going to be the preamble to the question. So he's just explaining something. Remember, it's a question about JavaScript.
Дозвольте навести приклад того, що було перекладено комп'ютером. Це був пост на форумі. Це був хтось, хто намагався поставити питання про JavaScript. Це було перекладено з японської на англійську. Тож я просто дам вам це прочитати. Ця особа почала з вибачень за використання машинного перекладу. Наступне речення -- це преамбула до самого питання. Він просто щось пояснює. Пам'ятайте, це питання про JavaScript.
[At often, the goat-time install a error is vomit.]
(Текст: На часто, кози-час установки помилка блювоту.)
(Laughter)
(Сміх)
Then comes the first part of the question.
Далі йде перша частина питання.
[How many times like the wind, a pole, and the dragon?]
(Текст: Скільки разів, як вітер, полюс, і дракон?)
(Laughter)
(Сміх)
Then comes my favorite part of the question.
Далі моя найулюбленіша частина питання.
[This insult to father's stones?]
(Текст: Це образа для каменів батька?)
(Laughter)
(Сміх)
And then comes the ending, which is my favorite part of the whole thing.
І далі завершення, яке я взагалі дуже люблю. (Текст: Будь ласка, вибачте за вашу тупість. Є багато дякую.)
[Please apologize for your stupidity. There are a many thank you.]
(Сміх)
(Laughter)
Тож машинний переклад все ще не достатньо якісний.
OK, so computer translation, not yet good enough. So back to the question. So we need people to translate the whole web. So now the next question you may have is, well, why can't we just pay people to do this? We could pay professional translators to translate the whole web. We could do that. Unfortunately, it would be extremely expensive. For example, translating a tiny fraction of the whole web, Wikipedia, into one other language, Spanish. OK? Wikipedia exists in Spanish, but it's very small compared to the size of English. It's about 20 percent of the size of English. If we wanted to translate the other 80 percent into Spanish, it would cost at least 50 million dollars -- and this is even at the most exploited, outsourcing country out there. So it would be very expensive. So what we want to do is, we want to get 100 million people translating the web into every major language for free.
Повернемось до нашого питання. Нам потрібні люди для перекладу всього Вебу. Наступне питання може бути таким: чому б нам просто не заплатити за це людям? Ми можемо заплатити професійним перекладачам для перекладу всього Вебу. Ми можемо це. На жаль, це буде надзвичайно дорого. Наприклад, переклад маленької, дрібненької частинки всього Вебу -- Вікіпедії -- на іншу мову, іспанську. Вікіпедія представлена іспанською, але вона дуже маленька порівняно з розмірами англійської частини. Вона становить приблизно 20% від розміру англійської. Якщо ми хочемо перекласти іспанською інші 80%, то це буде коштувати мінімум 50 мільйонів доларів -- і це тільки для країни, з найбільш дешевою працею. Тож це буде дуже дорого. А те що ми хочемо зробити -- це взяти 100 мільйонів людей для перекладу Вебу на всі основні мови безкоштовно.
If this is what you want to do, you quickly realize you're going to run into two big hurdles, two big obstacles. The first one is a lack of bilinguals. So I don't even know if there exists 100 million people out there using the web who are bilingual enough to help us translate. That's a big problem. The other problem you're going to run into is a lack of motivation. How are we going to motivate people to actually translate the web for free? Normally, you have to pay people to do this. So how are we going to motivate them to do it for free? When we were starting to think about this, we were blocked by these two things. But then we realized, there's a way to solve both these problems with the same solution. To kill two birds with one stone. And that is to transform language translation into something that millions of people want to do and that also helps with the problem of lack of bilinguals, and that is language education.
І якщо це все, що ви хочете зробити, то дуже швидко ви зрозумієте, що стикнетесь з двома великими перепонами, двома великими завадами. Перша -- це брак двомовних людей. Я навіть не знаю, чи існує 100 мільйонів людей, які використовують Веб і які достатньо володіють двома мовами, щоб допомогти нам у перекладі. Це велика проблема. Інша проблема -- ви стикнетесь з відсутністю мотивації. Як ви збираєтесь заохотити людей перекласти Веб безкоштовно? Зазвичай ви повинні заплатити людям за це. Тож як ви збираєтесь мотивувати їх зробити це безкоштовно? Коли ми почали думати над цим, то зупинились на цих двох речах. Але потім ми зрозуміли, що існує спосіб розв'язати ці дві проблеми одним рішенням. Існує спосіб вбити двох зайців одразу. І він полягає у перетворенні перекладу з мови на мову на щось, що мільйони людей захочуть зробити і це також допоможе з проблемою двомовних людей, і це -- вивчення мов.
So it turns out that today, there are over 1.2 billion people learning a foreign language. People really want to learn a foreign language. And it's not just because they're being forced to do so in school. In the US alone, there are over five million people who have paid over $500 for software to learn a new language. So people really want to learn a new language. So what we've been working on for the last year and a half is a new website -- it's called Duolingo -- where the basic idea is people learn a new language for free while simultaneously translating the web. And so basically, they're learning by doing.
Виявляється, що сьогодні є більше 1,2 мільярда людей, які вивчають іноземні мови. Люди дійсно дуже хочуть знати інші мови. І це не тільки тому, що їх змушують це робити в школі. Наприклад, тільки в Сполучених Штатах є більше 5 мільйонів людей, які платять більше 500 доларів за програмне забезпечення для вивчення нових мов. Тож люди дійсно дуже хочуть вивчати нові мови. І те, над чим ми працюємо останні півтора роки -- це новий веб сайт, який називається Duolingo. Його основна ідея: люди безкоштовно вивчають нові мови і також паралельно перекладають Веб. І здебільшого вони вчаться під час перекладу.
So the way this works is whenever you're a just a beginner, we give you very simple sentences. There's a lot of very simple sentences on the web. We give you very simple sentences along with what each word means. And as you translate them and as you see how other people translate them, you start learning the language. And as you get more advanced, we give you more complex sentences to translate. But at all times, you're learning by doing.
Це працює так, що коли ви просто початківець, ми даємо вам дуже прості речення. Звісно, існує багато дуже простих речень у Вебі. Ми даємо вам дуже прості речення разом із значенням кожного слова. І коли ви перекладаєте їх, дивитесь як перекладають їх інші люди, ви починаєте вчити мову. І коли ви вдосконалюєтесь, ми даємо вам все більш складні речення для перекладу. Але завжди ви вчитесь шляхом перекладу. І божевільна річ полягає в тому,
Now, the crazy thing about this method is that it actually really works. People are really learning a language. We're mostly done building it and now we're testing it. People really can learn a language with it. And they learn it about as well as the leading language learning software. So people really do learn a language. And not only do they learn it as well, but actually it's more interesting. Because with Duolingo, people are learning with real content. As opposed to learning with made-up sentences, people are learning with real content, which is inherently interesting. So people really do learn a language.
що це дійсно працює. По-перше, люди дійсно вивчають мови. Ми майже закінчили створювати його і тепер ми його тестуємо. Люди дійсно мають змогу вивчити мову. І вони вчаться так само добре, як і з найкращими програмами вивчення мов. Тож люди дійсно вивчають мови. І вони не тільки добре вчаться, вони це роблять навіть цікавіше. Розумієте, з Duolingo люди вчаться на реальних текстах. На противагу навчанню на штучних реченнях, люди вчаться на реальних речах, які по суті цікаві. Тож люди дійсно навчаються мовам.
But perhaps more surprisingly, the translations that we get from people using the site, even though they're just beginners, the translations that we get are as accurate as those of professional language translators, which is very surprising. So let me show you one example. This is a sentence that was translated from German into English. The top is the German. The middle is an English translation that was done by a professional translator who we paid 20 cents a word for this translation. And the bottom is a translation by users of Duolingo, none of whom knew any German before they started using the site. If you can see, it's pretty much perfect. Of course, we play a trick here to make the translations as good as professional language translators. We combine the translations of multiple beginners to get the quality of a single professional translator.
Але, мабуть, більш дивовижним є те, що переклади, які ми отримали від користувачів сайту, навіть коли вони тільки початківці, ці переклади настільки ж якісні, якби їх перекладали професійні перекладачі, що дуже дивує. Дозвольте показати приклад. Це речення, яке ми переклали з німецької на англійську. Верхнє речення німецькою. Середнє -- англійський переклад зроблений одним професійним перекладачем, якому ми заплатили 20 центів за кожне слово. І нижнє -- переклад користувачів Duolingo, жоден з яких не знав німецької до того, як почав використовувати цей сайт. Як ви можете побачити, воно майже досконале. Звісно, ми робимо дещо, щоб зробити переклади настільки ж гарними, як у професійних перекладачів. Ми комбінуємо переклади декількох початківців щоб отримати якість одного професійного перекладача.
Now, even though we're combining the translations, the site actually can translate pretty fast. So let me show you, this is our estimates of how fast we could translate Wikipedia from English into Spanish. Remember, this is 50 million dollars' worth of value. So if we wanted to translate Wikipedia into Spanish, we could do it in five weeks with 100,000 active users. And we could do it in about 80 hours with a million active users. Since all the projects my group has worked on so far have gotten millions of users, we're hopeful that we'll be able to translate extremely fast.
Навіть коли ми комбінуємо переклади, сайт може перекладати достатньо швидко. Дозвольте показати вам -- це наші оцінки наскільки швидко ми можемо перекласти Вікіпедію з англійської на іспанську. Пам'ятаєте, що це коштує 50 мільйонів доларів? Тож якщо ми хочемо перекласти Вікіпедію іспанською, ми можемо це зробити за п'ять тижнів зі 100 000 активних користувачів. І ми можемо це зробити за 80 годин з мільйоном активних користувачів. Адже всі проекти, з якими працювала до цього моя група, мали мільйони користувачів, ми сподіваємось, що зможемо перекладати дуже швидко за допомогою цього проекту.
Now, the thing that I'm most excited about with Duolingo is I think this provides a fair business model for language education. So here's the thing: The current business model for language education is the student pays, and in particular, the student pays Rosetta Stone 500 dollars.
І ось що мені найбільше подобається в проекті Duolingo: я гадаю, що він надає чесну бізнес модель навчання мов. Ось в чому річ. Поточна бізнес модель для мовної освіти враховує оплату студентів, і, зокрема, студенти платять 500 доларів Rosetta Stone.
(Laughter)
(Сміх)
That's the current business model. The problem with this business model is that 95 percent of the world's population doesn't have 500 dollars. So it's extremely unfair towards the poor. This is totally biased towards the rich. Now, see, in Duolingo, because while you learn, you're actually creating value, you're translating stuff -- which, for example, we could charge somebody for translations, so this is how we could monetize this. Since people are creating value while they're learning, they don't have to pay with their money, they pay with their time. But the magical thing here is that is time that would have had to have been spent anyways learning the language. So the nice thing about Duolingo is, I think, it provides a fair business model -- one that doesn't discriminate against poor people.
Це поточна бізнес модель. Проблема з цією моделлю в тому, що 95% населення світу не має 500 доларів. Тому це дуже нечесно по відношенню до бідних. Це повністю орієнтовано на багатих. Тепер, з Duolingo, коли ви вчитесь, ви насправді створюєте цінність, ви перекладаєте щось -- адже за це ми, наприклад, могли б найняти когось для перекладу. Ось як ми можемо це перетворити на гроші. Адже якщо люди створюють цінність, коли вони вчаться, їм не потрібно платити гроші за навчання, вони платять за це своїм часом. Чарівна річ тут в тому, що вони сплачують своїм часом, часом який би все-одно використали для вивчення мов. Тож, на мій погляд, гарна новина щодо Duolingo -- він надає чесну бізнес модель, таку, що не дискримінує бідних людей. А це сайт. Дякую.
So here's the site. Thank you.
(Аплодисменти)
(Applause)
Отже, це сайт.
We haven't yet launched, but if you go there, you can sign up to be part of our private beta, which is probably going to start in three or four weeks. We haven't yet launched it.
Ми ще не запустились, але якщо ви зайдете сюди, ви можете підписатись на його тестування, яке, мабуть, розпочнеться через 3-4 тижні. Ми ще не запустили Duolingo.
By the way, I'm the one talking here, but Duolingo is the work of a really awesome team,
Між іншим, я тут розповідав все це сам, але насправді, Duolingo -- це робота дійсно чудової команди. Деякі з цих людей представлені тут.
some of whom are here. So thank you.
Дякую.
(Applause)
(Аплодисменти)