How many of you had to fill out a web form where you've been asked to read a distorted sequence of characters like this? How many of you found it really annoying?
Koľkí z vás už vypĺňali formulár na internete a museli ste prečítať takýto zdeformovaný riadok znakov? Koľkí z vás to považovali za naozaj otravné? OK, výborne. Tak to som vynašiel ja.
(Laughter)
OK, outstanding. So I invented that.
(Smiech)
(Laughter)
Alebo som jedným z ľudí, ktorí to vymysleli.
Or I was one of the people who did it. That thing is called a CAPTCHA. And it is there to make sure you, the entity filling out the form, are a human and not a computer program that was written to submit the form millions of times. The reason it works is because humans, at least non-visually-impaired humans, have no trouble reading these distorted characters, whereas programs can't do it as well yet. In the case of Ticketmaster, the reason you have to type these characters is to prevent scalpers from writing a program that can buy millions of tickets, two at a time.
Volá sa to CAPTCHA. Zabezpečuje, aby formuláre vypĺňali ľudia a nie počítačové programy, schopné odoslať formulár miliónkrát. Funguje to, pretože ľudia, aspoň tí, ktorí vidia, tieto zdeformované znaky ľahko prečítajú. Počítačové programy to zatiaľ nedokážu. Napríklad, stránka Ticketmaster používa zdeformované znaky ako ochranu pred priekupníkmi, ktorí by pomocou softvéru mohli kúpiť milióny lístkov, vždy po dvoch kusoch.
CAPTCHAs are used all over the Internet. And since they're used so often, a lot of times the sequence of random characters shown to the user is not so fortunate. So this is an example from the Yahoo registration page. The random characters that happened to be shown to the user were W, A, I, T, which, of course, spell a word. But the best part is the message that the Yahoo help desk got about 20 minutes later.
CAPTCHA sa používa všade na internete. Keďže je taká rozšírená, často sa stáva, že zobrazený sled náhodných znakov nie je práve najšťastnejší. Toto je príklad z registračnej stránky Yahoo. Zobrazené náhodné znaky boli W, A, I, T, čiže ČAKAJTE. Najlepšia bola správa, ktorú o 20 minút dostali v Yahoo.
[Help! I've been waiting for over 20 minutes and nothing happens.]
Text:"Pomoc! Čakám už 20 minút a nič sa nedeje."
(Laughter)
(Smiech)
This person thought they needed to wait. This, of course, is not as bad as this poor person.
Tento človek si myslel, že má čakať. Stále lepšie, ako tento úbožiak.
(Laughter)
(Smiech)
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago, and it's been used everywhere. Let me now tell you about a project that we did a few years later, which is sort of the next evolution of CAPTCHA. This is a project that we call reCAPTCHA, which is something that we started here at Carnegie Mellon, then we turned it into a start-up company. And then about a year and a half ago, Google actually acquired this company.
Na projekte CAPTCHA sme pracovali na Carnegie Mellon pred 10 rokmi. Dnes sa používa všade. Teraz vám poviem o projekte, ktorý je o pár rokov mladší, ďalšia evolúcia CAPTCHA. Nazývame ho reCAPTCHA. Začali sme s ním na Carnegie Mellon a potom ho zmenili na startupovú spoločnosť. Asi o rok a pol túto spoločnosť kúpil Google.
Let me tell you what this project started. This project started from the following realization: It turns out that approximately 200 million CAPTCHAs are typed everyday by people around the world. When I first heard this, I was quite proud of myself. I thought, look at the impact my research has had. But then I started feeling bad. Here's the thing: each time you type a CAPTCHA, essentially, you waste 10 seconds of your time. And if you multiply that by 200 million, you get that humanity is wasting about 500,000 hours every day typing these annoying CAPTCHAs.
Poviem vám, čo tento projekt naštartovalo. Uvedomili sme si, že každý deň ľudia z celého sveta napíšu asi 200 miliónov CAPTCHA. Keď som to počul prvýkrát, bol som na seba hrdý. Pomyslel som si: Pozri aký dopad má tvoj výskum. Ale potom som sa začal cítiť zle. Pretože vždy, keď napíšete CAPTCHA, premrháte 10 sekúnd vášho času. Vynásobte to 200 miliónmi a zistíte, že ľudstvo každý deň premrhá 500 000 hodín písaním otravných CAPTCHA.
(Laughter)
Preto som sa cítil zle.
So then I started feeling bad.
(Smiech)
(Laughter)
Ale CAPTCHA sa nemôžeme len tak zbaviť,
And then I started thinking, of course, we can't just get rid of CAPTCHAs, because the security of the web depends on them. But then I started thinking, can we use this effort for something that is good for humanity? So see, here's the thing. While you're typing a CAPTCHA, during those 10 seconds, your brain is doing something amazing. Your brain is doing something that computers cannot yet do. So can we get you to do useful work for those 10 seconds? Is there some humongous problem that we cannot yet get computers to solve, yet we can split into tiny 10-second chunks such that each time somebody solves a CAPTCHA, they solve a little bit of this problem? And the answer to that is "yes," and this is what we're doing now.
pretože na nich záleží bezpečnosť internetu. Uvažoval som, či je spôsob, ako ich využiť na niečo osožné pre ľudstvo. Vec sa má takto: Počas 10 sekúnd, keď píšete CAPTCHA, váš mozog robí niečo úžasné. Niečo, čo ešte počítače nedokážu. Dokážeme tých 10 sekúnd robiť niečo užitočné? Inými slovami, jestvuje problém, ktorý počítače nevedia vyriešiť, a ktorý sa dá rozložiť na 10-sekundové kúsky, aby sa pri každom vyriešení CAPTCHA vyriešil kúsok tohto problému? Odpoveď je áno, a to práve robíme.
Nowadays, while you're typing a CAPTCHA, not only are you authenticating yourself as a human, but in addition you're helping us to digitize books. Let me explain how this works. There's a lot of projects trying to digitize books. Google has one. The Internet Archive has one. Amazon, with the Kindle, is trying to digitize books. Basically, the way this works is you start with an old book. You've seen those things, right? Like a book?
Možno neviete, že keď dnes napíšete CAPTCHA, okrem overenia, že ste človek nám pomáhate digitalizovať knihy. Vysvetlím, ako to funguje. Je mnoho projektov, ktorí sa snažia digitalizovať knihy. Jeden má Google. Internet Archive má druhý. Aj Amazon s Kindle sa pokúša digitalizovať knihy. Na začiatku máte starú knihu. Poznáte to, však? Kniha? (Smiech)
(Laughter)
Túto knihu zoskenujete.
So you start with a book and then you scan it.
Skenovaním knihy sa vytvorí
Now, scanning a book is like taking a digital photograph of every page. It gives you an image for every page. This is an image with text for every page of the book. The next step in the process is that the computer needs to be able to decipher the words in this image. That's using a technology called OCR, for optical character recognition, which takes a picture of text and tries to figure out what text is in there. Now, the problem is that OCR is not perfect. Especially for older books where the ink has faded and the pages have turned yellow, OCR cannot recognize a lot of the words. For things that were written more than 50 years ago, the computer cannot recognize about 30 percent of the words. So now we're taking all of the words that the computer cannot recognize and we're getting people to read them for us while they're typing a CAPTCHA on the Internet.
digitálna fotografia každej strany. Máte obrázok každej strany knihy. Obrázok s textom. V ďalšom kroku musí počítač rozlúštiť všetky slová na tomto obrázku. Používa technológiu OCR, optické rozlišovanie znakov, ktorá z obrázku textu skúša zistiť text. Ale OCR nie je dokonalá. Najmä pri starších knihách s vyblednutým atramentom a zožltnutými stranami OCR nedokáže mnohé slová rozlíšiť. Napríklad, pri veciach starších ako 50 rokov počítač nerozlíši asi 30 percent slov. My zbierame tie slová, ktoré počítač neprečíta, a posúvame ich ľuďom, aby ich prečítali, keď na internete vypĺňajú CAPTCHA.
So the next time you type a CAPTCHA, these words that you're typing are actually words from books that are being digitized that the computer could not recognize. The reason we have two words nowadays instead of one is because one of the words is a word that the system just got out of a book, it didn't know what it was and it's going to present it to you. But since it doesn't know the answer, it cannot grade it. So we give you another word, for which the system does know the answer. We don't tell you which one's which and we say, please type both. And if you type the correct word for the one for which the system knows the answer, it assumes you are human and it also gets some confidence that you typed the other word correctly. And if we repeat this process to 10 different people and they agree on what the new word is, then we get one more word digitized accurately.
Najbližšie, keď budete písať CAPTCHA, budete písať slová z kníh, ktoré sa digitalizujú a počítač ich nevedel rozpoznať. Dôvod, prečo dnes máme dve slová miesto jedného je, že jedno z týchto slov je slovo z knihy, ktoré systém nepozná. Preto nemôže vašu odpoveď vyhodnotiť. Preto vám dávame ešte jedno slovo, ktoré systém pozná. Nepovieme vám, ktoré je ktoré. Musíte napísať obidve. Ak napíšete to správne, ktoré systém pozná, bude predpokladať, že ste človek a tiež, že ste napísali správne aj druhé slovo. Keď tento proces zopakujeme s 10 ľuďmi a všetci sa na novom slove zhodnú, máme o jedno správne digitalizované slovo viac.
So this is how the system works. And since we released it about three or four years ago, a lot of websites have started switching from the old CAPTCHA, where people wasted their time, to the new CAPTCHA where people are helping to digitize books. So every time you buy tickets on Ticketmaster, you help to digitize a book. Facebook: Every time you add a friend or poke somebody, you help to digitize a book. Twitter and about 350,000 other sites are all using reCAPTCHA. And the number of sites that are using reCAPTCHA is so high that the number of words we're digitizing per day is really large. It's about 100 million a day, which is the equivalent of about two and a half million books a year. And this is all being done one word at a time by just people typing CAPTCHAs on the Internet.
Takto náš systém funguje. Keďže sme ho spustili pred tromi či štyrmi rokmi, mnoho webstránok prechádza zo starej CAPTCHA, ktorá mrhá časom, na novú CAPTCHA, s ktorou ľudia pomáhajú digitalizovať knihy. Napríklad, Ticketmaster. Vždy keď si kúpite na lístky cez Ticketmaster, pomôžete zdigitalizovať knihu. Facebook: Vždy, keď si pridáte priateľa, alebo niekoho šťuchnete, pomáhate zdigitalizovať knihu. Twitter a ďalších 350 000 stránok používa reCAPTCHA. Stránok, ktoré reCAPTCHA používajú, je tak veľa, že počet digitalizovaných slov za deň je obrovský. Je ich asi 100 miliónov za deň, teda asi dva a pol milióna kníh za rok. To všetko slovo po slove, písaním CAPTCHA na internete. (Potlesk)
(Applause)
Tým, že počet slov za deň
Now, of course, since we're doing so many words per day, funny things can happen. This is especially true because now we're giving people two randomly chosen English words next to each other. So funny things can happen. For example, we presented this word. It's the word "Christians"; there's nothing wrong with it. But if you present it along with another randomly chosen word, bad things can happen. So we get this.
je taký veľký, dejú sa zvláštne veci. Najmä teraz, keď dávame ľuďom dve náhodné anglické slová vedľa seba. Dejú sa zaujímavé veci. Napríklad, mali sme slovo "Kresťania", čo je celkom v poriadku. Ale v spojení s iným náhodným slovom sa môže stať všeličo. Napríklad toto. (Text: zlí kresťania)
[bad Christians]
Ešte horšie bolo, že stránka, na ktorej sa text ukázal,
But it's even worse, because the website where we showed this actually happened to be called The Embassy of the Kingdom of God.
sa volala Ambasáda Božieho Kráľovstva. (Smiech)
(Laughter)
Ups.
Oops.
(Smiech)
(Laughter)
Tu je ďalší veľmi zlý.
Here's another really bad one. JohnEdwards.com
JohnEdwards.com (Text: Prekliaty liberál)
[Damn liberal]
(Laughter)
(Smiech)
So we keep on insulting people left and right everyday. Of course, we're not just insulting people. Here's the thing. Since we're presenting two randomly chosen words, interesting things can happen. So this actually has given rise to a really big Internet meme that tens of thousands of people have participated in, which is called CAPTCHA art. I'm sure some of you have heard about it. Here's how it works. Imagine you're using the Internet and you see a CAPTCHA that you think is somewhat peculiar, like this CAPTCHA.
Urážame ľudí napravo i naľavo. Samozrejme, nerobíme len to. Tým, že prezentujeme dve náhodné slová, dejú sa zaujímavé veci. Naštartovali sme skutočne veľký internetový meme, na ktorom sa podieľajú desiatky tisíc ľudí. Volá sa umenie CAPTCHA. Niektorí z vás o ňom iste počuli. Takto funguje. Uvidíte na internete CAPTCHA, ktorá je zvláštna, ako táto (Text: neviditeľný hriankovač)
[invisible toaster]
a urobíte z nej screenshot.
What you're supposed to do is you take a screenshot of it. Then of course, you fill out the CAPTCHA because you help us digitize a book. But first you take a screenshot and then you draw something that is related to it.
Potom CAPTCHA vyplníte, pretože nám pomáhate digitalizovať knihu. Potom, čo spravíte screenshot, k nemu niečo vhodné dokreslíte.
(Laughter)
(Smiech)
That's how it works.
Takto to funguje.
(Laughter)
Sú ich desiatky tisíc.
There are tens of thousands of these. Some of them are very cute.
Niektoré si naozaj milé. (Text: Zaťal som)
[clenched it]
(Smiech)
(Laughter)
Niektoré sú veselšie.
Some of them are funnier.
(Text: zhúlení zakladatelia)
[stoned Founders]
(Laughter)
(Smiech)
And some of them, like paleontological shvisle ...
A niektoré,
(Laughter)
ako paleontologický švizl,
they contain Snoop Dogg.
obsahujú Snoop Dogga.
(Laughter)
(Smiech)
OK, so this is my favorite number of reCAPTCHA. So this is the favorite thing that I like about this whole project. This is the number of distinct people that have helped us digitize at least one word out of a book through reCAPTCHA: 750 million, a little over 10 percent of the world's population, has helped us digitize human knowledge. And it is numbers like these that motivate my research agenda. So the question that motivates my research is the following: If you look at humanity's large-scale achievements, these really big things that humanity has gotten together and done historically -- like, for example, building the pyramids of Egypt or the Panama Canal or putting a man on the Moon -- there is a curious fact about them, and it is that they were all done with about the same number of people. It's weird; they were all done with about 100,000 people. And the reason for that is because, before the Internet, coordinating more than 100,000 people, let alone paying them, was essentially impossible. But now with the Internet, I've just shown you a project where we've gotten 750 million people to help us digitize human knowledge. So the question that motivates my research is, if we can put a man on the Moon with 100,000, what can we do with 100 million?
Moje obľúbené číslo týkajúce sa reCAPTCHA je počet ľudí, ktorí nám pomohli zdigitalizovať aspoň jedno slovo pomocou reCAPTCHA: 750 miliónov, o niečo viac ako 10 percent svetovej populácie nám pomohlo s digitalizáciou ľudských vedomostí. Takéto čísla ma motivujú pri výskume. Otázka, ktorá ma motivuje, znie: Ak sa pozriete na veľké úspechy ľudstva, tie naozaj veľké veci, ktoré ľudstvo vytvorilo - napríklad pyramídy v Egypte alebo Panamský prieplav, či človek na Mesiaci - je na nich zaujímavé, že boli vykonané približne rovnakým počtom ľudí. Je to zvláštne; na každej z nich pracovalo asi 100 000 ľudí. To preto, že pred nástupom internetu bolo nemožné koordinovať viac ako 100 000 ľudí, a už vôbec nie ich zaplatiť. Teraz, s internetom, ako som práve ukázal, sme schopní spojiť 750 miliónov ľudí, aby nám pomohli digitalizovať ľudské vedomosti. Takže otázka, ktorá motivuje môj výskum, je, ak s 100 000 ľuďmi dostaneme človeka na Mesiac, čo dokážeme so 100 miliónmi?
So based on this question, we've had a lot of different projects that we've been working on. Let me tell you about one that I'm most excited about. This is something that we've been semiquietly working on for the last year and a half or so. It hasn't yet been launched. It's called Duolingo. Since it hasn't been launched, shhh!
Na základe tejto otázky sme rozpracovali viacero projektov. Poviem vám o tom, ktorý ma nadchýna najviac. Potichu na ňom pracujeme už asi rok a pol. Zatiaľ nebol spustený. Nazýva sa Duolingo. Keďže nebol spustený, šššš!
(Laughter)
(Smiech)
Yeah, I can trust you'll do that. So this is the project. Here's how it started. It started with me posing a question to my graduate student, Severin Hacker. OK, that's Severin Hacker. So I posed the question to my graduate student. By the way, you did hear me correctly; his last name is Hacker.
Určite si to necháte pre seba. Tento projekt začal otázkou, ktorú som položil môjmu doktorandovi, Severinovi Hackerovi. Toto je Severin Hacker. Položil som mu otázku. Mimochodom, počujete správne; jeho priezvisko je Hacker.
(Laughter)
Opýtal som sa ho:
So I posed this question to him: How can we get 100 million people translating the web into every major language for free? There's a lot of things to say about this question. First of all, translating the web. Right now, the web is partitioned into multiple languages. A large fraction of it is in English. If you don't know English, you can't access it. But there's large fractions in other different languages, and if you don't know them, you can't access it. So I would like to translate all of the web, or at least most of it, into every major language. That's what I would like to do.
Ako môžeme primäť 100 miliónov ľudí, aby zadarmo prekladali internet do všetkých svetových jazykov? K tejto otázke je potrebné povedať viacero vecí. V prvom rade prekladanie internetu. Teraz je internet zložený z viacerých jazykov. Z veľkej časti je v anglickom jazyku. Ak neviete po anglicky, nedostanete sa naň. Ale veľké časti sú v iných jazykoch, a ak neviete tieto jazyky, nemáte doň prístup. Chcel by som preložiť celý, alebo aspoň väčšinu internetu do všetkých svetových jazykov. To je môj cieľ.
Now, some of you may say, why can't we use computers to translate? Machine translation is starting to translate some sentences here and there. Why can't we use it to translate the web? The problem with that is it's not yet good enough and it probably won't be for the next 15 to 20 years. It makes a lot of mistakes. Even when it doesn't, since it makes so many mistakes, you don't know whether to trust it or not.
Niekto sa môže opýtať, prečo na to nepoužijeme počítače? Prečo nepoužijeme strojový preklad? Strojový preklad sa dnes už používa na rôznych miestach. Prečo ho nemôžeme použiť na preklad celého internetu? Problém je, že ešte nie je dosť dobrý. a pravdepodobne nebude najbližších 15 až 20 rokov. Robí veľa chýb. Dokonca aj keď neurobí chybu, nemôžete mu dôverovať, pretože robí toľko chýb.
So let me show you an example of something that was translated with a machine. Actually, it was a forum post. It was somebody who was trying to ask a question about JavaScript. It was translated from Japanese into English. So I'll just let you read. This person starts apologizing for the fact that it's translated with a computer. So the next sentence is going to be the preamble to the question. So he's just explaining something. Remember, it's a question about JavaScript.
Ukážem vám príklad textu preloženého strojom. Je to otázka z fóra. Niekto sa snažil položiť otázku ohľadom JavaScriptu. Bola preložená z japončiny do angličtiny. Prečítajte si. Táto osoba začína ospravedlnením, za to, že otázka je preložená počítačom. Ďalšia veta je úvod k otázke. Niečo sa snaží vysvetliť. Pamätajte, že je to otázka k JavaScriptu.
[At often, the goat-time install a error is vomit.]
(Text: Na často kôz čas nainštalovať chybu je vývratku.)
(Laughter)
(Smiech)
Then comes the first part of the question.
Potom príde prvá časť otázky.
[How many times like the wind, a pole, and the dragon?]
(Text: Koľkokrát ako vietor, pólovým a drak?)
(Laughter)
(Smiech)
Then comes my favorite part of the question.
Potom príde moja najobľúbenejšia časť otázky.
[This insult to father's stones?]
(Text: Túto urážku na otec to kameňov?)
(Laughter)
(Smiech)
And then comes the ending, which is my favorite part of the whole thing.
A na záver prichádza moja najobľúbenejšia časť. (Text: Prosím ospravedlňte sa za vašu hlúposť. Existuje mnoho ďakujem.)
[Please apologize for your stupidity. There are a many thank you.]
(Smiech)
(Laughter)
Počítačový preklad teda ešte nie je dosť dobrý.
OK, so computer translation, not yet good enough. So back to the question. So we need people to translate the whole web. So now the next question you may have is, well, why can't we just pay people to do this? We could pay professional translators to translate the whole web. We could do that. Unfortunately, it would be extremely expensive. For example, translating a tiny fraction of the whole web, Wikipedia, into one other language, Spanish. OK? Wikipedia exists in Spanish, but it's very small compared to the size of English. It's about 20 percent of the size of English. If we wanted to translate the other 80 percent into Spanish, it would cost at least 50 million dollars -- and this is even at the most exploited, outsourcing country out there. So it would be very expensive. So what we want to do is, we want to get 100 million people translating the web into every major language for free.
Takže späť k otázke. Potrebujeme ľudí, aby preložili celý internet. Takže ďalšia otázka môže byť, prečo za to jednoducho nemôžeme ľuďom zaplatiť? Mohli by sme zaplatiť profesionálnym prekladateľom, aby internet preložili. To by sme mohli. Bohužiaľ, bolo by to veľmi nákladné. Napríklad, preklad maličkého zlomku celého internetu, Wikipedia, iba do jedného jazyka, španielčiny. Wikipedia existuje v španielčine, ale je veľmi malá v porovnaní s angličtinou. Je to asi 20 percent veľkosti angličtiny. Ak by sme chceli preložiť 80 percent do španielčiny, stálo by to najmenej 50 miliónov dolárov - aj to v tej najvyužívanejšej krajine, kam by sa to dalo outsourcovať. Teda bolo by to veľmi drahé. Chceme teda primäť 100 miliónov ľudí, aby prekladali internet do všetkých svetových jazykov zadarmo.
If this is what you want to do, you quickly realize you're going to run into two big hurdles, two big obstacles. The first one is a lack of bilinguals. So I don't even know if there exists 100 million people out there using the web who are bilingual enough to help us translate. That's a big problem. The other problem you're going to run into is a lack of motivation. How are we going to motivate people to actually translate the web for free? Normally, you have to pay people to do this. So how are we going to motivate them to do it for free? When we were starting to think about this, we were blocked by these two things. But then we realized, there's a way to solve both these problems with the same solution. To kill two birds with one stone. And that is to transform language translation into something that millions of people want to do and that also helps with the problem of lack of bilinguals, and that is language education.
S týmto cieľom si rýchlo uvedomíte, že máte v ceste dve dosť veľké prekážky, dva veľké problémy. Prvý je nedostatok ľudí hovoriacich dvoma jazykmi. Ani neviem, či existuje 100 miliónov ľudí, ktorí používajú internet, ktorí sú dosť bilingválni, aby nám pomáhali s prekladom. To je veľký problém. Ďalším problémom je nedostatok motivácie. Ako budeme motivovať ľudí, aby skutočne prekladali internet zadarmo? Väčšinou za niečo také musíte ľudom zaplatiť. Tak ako ich motivovať, aby to robili zadarmo? Tieto dve veci nás brzdili pri počiatočných úvahách. Ale potom sme si uvedomili, že je spôsob ako vyriešiť oba problémy naraz. Existuje spôsob, ako zabiť dve muchy jednou ranou. A to je transformovať preklad na niečo, čo milióny ľudí chcú urobiť, a čo zároveň pomáha s problémom nedostatku dvojjazyčných ľudí, a to je jazykové vzdelávanie.
So it turns out that today, there are over 1.2 billion people learning a foreign language. People really want to learn a foreign language. And it's not just because they're being forced to do so in school. In the US alone, there are over five million people who have paid over $500 for software to learn a new language. So people really want to learn a new language. So what we've been working on for the last year and a half is a new website -- it's called Duolingo -- where the basic idea is people learn a new language for free while simultaneously translating the web. And so basically, they're learning by doing.
Dnes máme viac ako 1,2 miliardy ľudí, ktorí sa učia cudzí jazyk. Ľudia sa naozaj chcú učiť cudzie jazyky. A nie len preto, že sú k tomu nútení v škole. Napríklad, len v Spojených štátoch je viac ako päť miliónov ľudí, ktorí zaplatili cez 500 dolárov za softvér, s ktorým sa učia nový jazyk. Takže ľudia sa naozaj chcú naučiť nový jazyk. Posledný rok a pol sme pracovali na novej internetovej stránke. Nazýva sa Duolingo. Hlavná myšlienka je, že ľudia sa učia nový jazyk zadarmo zatiaľ čo súčasne prekladajú internet. A tým sa v podstate učia.
So the way this works is whenever you're a just a beginner, we give you very simple sentences. There's a lot of very simple sentences on the web. We give you very simple sentences along with what each word means. And as you translate them and as you see how other people translate them, you start learning the language. And as you get more advanced, we give you more complex sentences to translate. But at all times, you're learning by doing.
Funguje to tak, že ak ste úplný začiatočník, dáme vám celkom jednoduché vety. Internet je plný veľmi jednoduchých viet. Dáme vám veľmi jednoduché vety spolu s významom jednotlivých slov. Tým, že ich prekladáte a vidíte preklady iných, sa začnete učiť jazyk. Čím ste pokročilejší, tým zložitejšie a komplexnejšie vety dostanete na preloženie. Po celý čas sa práve tým učíte. Bláznivé na tom je,
Now, the crazy thing about this method is that it actually really works. People are really learning a language. We're mostly done building it and now we're testing it. People really can learn a language with it. And they learn it about as well as the leading language learning software. So people really do learn a language. And not only do they learn it as well, but actually it's more interesting. Because with Duolingo, people are learning with real content. As opposed to learning with made-up sentences, people are learning with real content, which is inherently interesting. So people really do learn a language.
že to naozaj funguje. Po prvé, ľudia sa naozaj učia jazyk. S výstavbou sme takmer hotový a teraz to testujeme. Ľudia sa takto naozaj môžu naučiť jazyk. Naučia sa ho rovnako dobre ako s najlepším jazykovým softvérom. Takže ľudia sa naozaj učia jazyk. A nielen, že sa ho učia dobre, ale je to aj oveľa zaujímavejšie. Pretože s Duolingom sa ľudia učia na skutočnom obsahu, a nie na vymyslených vetách. Učia sa na skutočnom obsahu, ktorý je vo svojej podstate zaujímavý. Takže ľudia sa naozaj učia jazyk.
But perhaps more surprisingly, the translations that we get from people using the site, even though they're just beginners, the translations that we get are as accurate as those of professional language translators, which is very surprising. So let me show you one example. This is a sentence that was translated from German into English. The top is the German. The middle is an English translation that was done by a professional translator who we paid 20 cents a word for this translation. And the bottom is a translation by users of Duolingo, none of whom knew any German before they started using the site. If you can see, it's pretty much perfect. Of course, we play a trick here to make the translations as good as professional language translators. We combine the translations of multiple beginners to get the quality of a single professional translator.
Ešte prekvapivejšie je, že preklady, ktoré dostávame od používateľov stránky, dokonca aj od úplných začiatočníkov, sú také presné ako od profesionálnych prekladateľov, čo je veľmi prekvapujúce. Dovoľte mi ukázať vám jeden príklad. Toto je veta, ktorá bola preložená z nemčiny do angličtiny. Hore je nemčina. V strede je anglický preklad od profesionálneho prekladateľa, ktorý za tento preklad dostal 20 centov za slovo. Dole je preklad od užívateľov Duolingo, z ktorých nikto nevedel po nemecky, predtým, ako začal stránku používať. Ako vidíte, je to vlastne dokonalé. Samozrejme, aby boli naše preklady také dobré ako od profesionálnych prekladateľov, používame trik. Spájame preklady viacerých začiatočníkov, aby sme získali kvalitu jedného profesionálneho prekladateľa.
Now, even though we're combining the translations, the site actually can translate pretty fast. So let me show you, this is our estimates of how fast we could translate Wikipedia from English into Spanish. Remember, this is 50 million dollars' worth of value. So if we wanted to translate Wikipedia into Spanish, we could do it in five weeks with 100,000 active users. And we could do it in about 80 hours with a million active users. Since all the projects my group has worked on so far have gotten millions of users, we're hopeful that we'll be able to translate extremely fast.
Aj keď preklady kombinujeme, stránka vie prekladať celkom rýchlo. Ukážem vám náš odhad, ako rýchlo by sme mohli preložiť Wikipediu z angličtiny do španielčiny. Pamätajte si, že je to hodné 50 miliónov dolárov. Na preklad Wikipédie do španielčiny, by sme potrebovali päť týždňov so 100 000 aktívnymi užívateľmi. S miliónom aktívnych užívateľov by sme to zvládli za asi 80 hodín. Pretože všetky projekty, na ktorých moja skupina doteraz pracovala, získali milióny užívateľov, veríme, že nám tento projekt umožní prekladať extrémne rýchlo.
Now, the thing that I'm most excited about with Duolingo is I think this provides a fair business model for language education. So here's the thing: The current business model for language education is the student pays, and in particular, the student pays Rosetta Stone 500 dollars.
Pri Duolingo som najviac nadšený z toho, že ho považujem za spravodlivý obchodný model jazykového vzdelávania. Súčasný obchodný model jazykového vzdelávania je, že študent platí, konkrétne za softvér Rosetta Stone zaplatí 500 dolárov.
(Laughter)
(Smiech)
That's the current business model. The problem with this business model is that 95 percent of the world's population doesn't have 500 dollars. So it's extremely unfair towards the poor. This is totally biased towards the rich. Now, see, in Duolingo, because while you learn, you're actually creating value, you're translating stuff -- which, for example, we could charge somebody for translations, so this is how we could monetize this. Since people are creating value while they're learning, they don't have to pay with their money, they pay with their time. But the magical thing here is that is time that would have had to have been spent anyways learning the language. So the nice thing about Duolingo is, I think, it provides a fair business model -- one that doesn't discriminate against poor people.
To je súčasný obchodný model. Problém s týmto obchodným modelom je, že 95 percent svetovej populácie nemá 500 dolárov. K chudobným je extrémne nespravodlivý. Je nastavený pre bohatých. V Duolingo počas učenia vytvárate hodnotu, prekladáte - za tie preklady by sme si mohli pýtať peniaze. Mať z nich zisk. Keďže ľudia v rámci učenia vytvárajú hodnoty, nemusia platiť peniazmi, platia svojim časom. To čarovné na to je, že síce platia svojim časom ale ten čas, by aj tak strávili učením sa jazyka. To pekné na Duolingo je, že poskytuje spravodlivý obchodný model - taký, ktorý nediskriminuje chudobných. Tu je naša stránka. Ďakujem.
So here's the site. Thank you.
(Potlesk)
(Applause)
Tu je naša stránka.
We haven't yet launched, but if you go there, you can sign up to be part of our private beta, which is probably going to start in three or four weeks. We haven't yet launched it.
Ešte nie je spustená, ale môžete sa prihlásiť na testovanie, ktoré začne asi o tri alebo štyri týždne. Duolingo sme ešte nespustili.
By the way, I'm the one talking here, but Duolingo is the work of a really awesome team,
Mimochodom, ja som ten, ktorý tu hovorí, ale Duolingo je prácou naozaj úžasného tímu, ktorého niektorí členovia sú tu.
some of whom are here. So thank you.
Ďakujeme.
(Applause)
(Potlesk)