How many of you had to fill out a web form where you've been asked to read a distorted sequence of characters like this? How many of you found it really annoying?
Quanti di voi hanno dovuto riempire qualche tipo di modulo via web dove viene chiesto di leggere una sequenza distorta di caratteri come questa? Quanti di voi l'hanno trovato molto, molto irritante? Ok, notevole. L'ho inventata io.
(Laughter)
OK, outstanding. So I invented that.
(Risate)
(Laughter)
O almeno ero una delle persone che lo ha fatto.
Or I was one of the people who did it. That thing is called a CAPTCHA. And it is there to make sure you, the entity filling out the form, are a human and not a computer program that was written to submit the form millions of times. The reason it works is because humans, at least non-visually-impaired humans, have no trouble reading these distorted characters, whereas programs can't do it as well yet. In the case of Ticketmaster, the reason you have to type these characters is to prevent scalpers from writing a program that can buy millions of tickets, two at a time.
Quella cosa si chiama CAPTCHA. E il motivo per cui è lì è assicurarsi è che voi, l'entità che sta riempiendo il modulo, sia realmente un essere umano e non un programma scritto per inviare il modulo milioni e milioni di volte. Il motivo per cui funziona è perché gli esseri umani, almeno gli umani che non hanno problemi di vista, non hanno problemi a leggere questi caratteri ondulati e distorti, mentre un programma di computer non lo può fare altrettanto bene. Quindi per esempio, nel caso di Ticketmaster, il motivo per cui dovete digitare questi caratteri distorti è prevenire che i bagarini scrivano un programma che possa comprare milioni di biglietti, due alla volta.
CAPTCHAs are used all over the Internet. And since they're used so often, a lot of times the sequence of random characters shown to the user is not so fortunate. So this is an example from the Yahoo registration page. The random characters that happened to be shown to the user were W, A, I, T, which, of course, spell a word. But the best part is the message that the Yahoo help desk got about 20 minutes later.
I CAPTCHA vengono utilizzati ovunque su Internet. E considerato che sono utilizzati così di frequente, tante volte la sequenza precisa di caratteri casuali mostrata all'utente non è così fortunata. Questo è un esempio dalla pagina di registrazione di Yahoo. I caratteri casuali che sono capitati all'utente sono stati A,T,T,E,N,D,I, che ovviamente scandiscono una parola. Ma la parte migliore è il messaggio che il servizio clienti di Yahoo ha ricevuto 20 minuti dopo.
[Help! I've been waiting for over 20 minutes and nothing happens.]
Testo:"Aiuto! Sto aspettando da più di 20 minuti e non succede niente."
(Laughter)
(Risate)
This person thought they needed to wait. This, of course, is not as bad as this poor person.
Questa persona ha pensato di dover aspettare. Certo, questo poveraccio non è messo tanto bene.
(Laughter)
(Risate)
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago, and it's been used everywhere. Let me now tell you about a project that we did a few years later, which is sort of the next evolution of CAPTCHA. This is a project that we call reCAPTCHA, which is something that we started here at Carnegie Mellon, then we turned it into a start-up company. And then about a year and a half ago, Google actually acquired this company.
Il progetto CAPTCHA è una cosa che abbiamo creato qui al Carnegie Mellon più di 10 anni fa, e viene utilizzata ovunque. Lasciate che ora vi racconti del progetto che abbiamo seguito qualche anno dopo, che è l'evoluzione del CAPTCHA. È un progetto che chiamiamo reCAPTCHA, ed è una cosa che abbiamo iniziato qui al Carnegie Mellon, e che poi abbiamo trasformato in startup. E poi circa un anno e mezzo fa, Google ha acquistato la società.
Let me tell you what this project started. This project started from the following realization: It turns out that approximately 200 million CAPTCHAs are typed everyday by people around the world. When I first heard this, I was quite proud of myself. I thought, look at the impact my research has had. But then I started feeling bad. Here's the thing: each time you type a CAPTCHA, essentially, you waste 10 seconds of your time. And if you multiply that by 200 million, you get that humanity is wasting about 500,000 hours every day typing these annoying CAPTCHAs.
Fatemi spiegare che cosa ha dato il via questo progetto. Questo progetto nasce dalla seguente constatazione: che circa 200 milioni di CAPTCHA vengono digitati ogni giorno dalla gente in tutto il mondo. Quando l'ho sentito, mi sono sentito fiero di me stesso. Ho pensato, guarda che impatto ha avuto la mia ricerca. Ma poi ho cominciato a sentirmi male. Ecco perché, ogni volta che digitate un CAPTCHA, sostanzialmente sprecate 10 secondi del vostro tempo. E se lo moltiplicate per 200 milioni, ottenete che l'umanità intera spreca circa 500 000 ore ogni giorno a digitare questi fastidiosi CAPTCHA.
(Laughter)
Allora ho cominciato a sentirmi male.
So then I started feeling bad.
(Risate)
(Laughter)
E poi ho cominciato a pensare, certo, non possiamo sbarazzarci dei CAPTCHA,
And then I started thinking, of course, we can't just get rid of CAPTCHAs, because the security of the web depends on them. But then I started thinking, can we use this effort for something that is good for humanity? So see, here's the thing. While you're typing a CAPTCHA, during those 10 seconds, your brain is doing something amazing. Your brain is doing something that computers cannot yet do. So can we get you to do useful work for those 10 seconds? Is there some humongous problem that we cannot yet get computers to solve, yet we can split into tiny 10-second chunks such that each time somebody solves a CAPTCHA, they solve a little bit of this problem? And the answer to that is "yes," and this is what we're doing now.
perché la sicurezza del Web in qualche modo ne dipende. Ma poi ho cominciato a pensare, c'è un modo di usare questo sforzo per qualcosa che sia buono per l'umanità? Vedete, ecco qui. Mentre digitate un CAPTCHA, durante questi 10 secondi, il vostro cervello sta facendo qualcosa di straordinario. Sta facendo quello che un computer non può ancora fare. Possiamo portarvi a fare un lavoro utile in questi 10 secondi? Si può metterla in altro modo, c'è qualche problema enorme che non riusciamo ancora a far risolvere ai computer, e che possiamo spezzare in pezzetti da 10 secondi così che ogni volta che qualcuno risolve un CAPTCHA risolve un piccolo pezzo di questo problema? E la risposta è "si", ed ecco cosa stiamo facendo ora.
Nowadays, while you're typing a CAPTCHA, not only are you authenticating yourself as a human, but in addition you're helping us to digitize books. Let me explain how this works. There's a lot of projects trying to digitize books. Google has one. The Internet Archive has one. Amazon, with the Kindle, is trying to digitize books. Basically, the way this works is you start with an old book. You've seen those things, right? Like a book?
Quello che potreste non sapere è che oggi mentre digitate un CAPTCHA, non solo vi state identificando come essere umano, ma oltre a questo, di fatto, ci state aiutando a digitalizzare libri. Fatemi spiegare come funziona. Ci sono tantissimi progetti che cercano di digitalizzare libri. Google ne segue uno. The Internet Archive ne ha uno. Amazon, ora con il Kindle, sta cercando di digitalizzare libri. Sostanzialmente funziona in questo modo: si comincia con un vecchio libro. Avete visto queste cose, vero? Un libro? (Risate)
(Laughter)
Cominciate con un libro, lo scannerizzate.
So you start with a book and then you scan it.
Scannerizzare un libro
Now, scanning a book is like taking a digital photograph of every page. It gives you an image for every page. This is an image with text for every page of the book. The next step in the process is that the computer needs to be able to decipher the words in this image. That's using a technology called OCR, for optical character recognition, which takes a picture of text and tries to figure out what text is in there. Now, the problem is that OCR is not perfect. Especially for older books where the ink has faded and the pages have turned yellow, OCR cannot recognize a lot of the words. For things that were written more than 50 years ago, the computer cannot recognize about 30 percent of the words. So now we're taking all of the words that the computer cannot recognize and we're getting people to read them for us while they're typing a CAPTCHA on the Internet.
è come scattare una foto digitale di ogni singola pagina. Vi dà un'immagine di ogni singola pagina del libro. Questa è un'immagine con testo di ogni pagina del libro. Il passo successivo del processo è che il computer deve essere in grado di decifrare tutte le parole in questa immagine. Lo si fa usando una tecnologia chiamata OCR, per il riconoscimento ottico dei caratteri, che scatta una foto del testo e cerca di decifrarlo. Il problema è che l'OCR non è perfetto. Specialmente per i libri più vecchi dove l'inchiostro è sbiadito e le pagine sono ingiallite, l'OCR non riesce a riconoscere tante parole. Per esempio, per cose che sono state scritte più di 50 anni fa, il computer non riesce a riconoscere circa il 30% delle parole. Quindi quello che facciamo ora è prendere tutte le parole che il computer non riesce a riconoscere e far sì che le persone le leggano per noi mentre digitano un CAPTCHA su Internet.
So the next time you type a CAPTCHA, these words that you're typing are actually words from books that are being digitized that the computer could not recognize. The reason we have two words nowadays instead of one is because one of the words is a word that the system just got out of a book, it didn't know what it was and it's going to present it to you. But since it doesn't know the answer, it cannot grade it. So we give you another word, for which the system does know the answer. We don't tell you which one's which and we say, please type both. And if you type the correct word for the one for which the system knows the answer, it assumes you are human and it also gets some confidence that you typed the other word correctly. And if we repeat this process to 10 different people and they agree on what the new word is, then we get one more word digitized accurately.
Quindi la prossima volta che digitate un CAPTCHA, queste parole che state digitando sono in realtà parole che provengono da libri che sono stati digitalizzati che il computer non è riuscito a riconoscere. E il motivo per cui oggi ci sono due parole invece di una è perché, sapete, una delle parole è una parola che il sistema ha tirato fuori da un libro, e che non sapeva cosa fosse, e ve la sottopone. Ma siccome non sa la risposta, non può valutarla. Quindi quello che facciamo è assegnarvi un'altra parola, di cui il sistema conosce la risposta. Non vi diciamo quale delle due, e vi chiediamo di digitarle entrambe. E se digitate la parola giusta per quella di cui il sistema conosce già la risposta, suppone che siate umani, ed è abbastanza fiducioso che abbiate digitato l'altra parola correttamente. E se ripetete questo processo per 10 persone diverse e tutte sono d'accordo su qual è la parola nuova, si ottiene un'altra parola digitalizzata correttamente.
So this is how the system works. And since we released it about three or four years ago, a lot of websites have started switching from the old CAPTCHA, where people wasted their time, to the new CAPTCHA where people are helping to digitize books. So every time you buy tickets on Ticketmaster, you help to digitize a book. Facebook: Every time you add a friend or poke somebody, you help to digitize a book. Twitter and about 350,000 other sites are all using reCAPTCHA. And the number of sites that are using reCAPTCHA is so high that the number of words we're digitizing per day is really large. It's about 100 million a day, which is the equivalent of about two and a half million books a year. And this is all being done one word at a time by just people typing CAPTCHAs on the Internet.
Quindi il sistema funziona in questo modo. E sostanzialmente, da quanto l'abbiamo rilasciato circa 3 o 4 anni fa, tantissimi siti hanno cominciato a passare dal vecchio CAPTCHA dove la gente buttava via il tempo al nuovo CAPTCHA dove la gente aiuta a digitalizzare libri. Per esempio, Ticketmaster. Ogni volta che comprate biglietti con Ticketmaster, aiutate a digitalizzare un libro. Facebook: Ogni volta che aggiungete un amico o fate un poke a qualcuno, aiutate a digitalizzare un libro. Twitter e circa 350 000 altri sisti usano tutti reCAPTCHA. E in realtà, il numero di siti che usano reCAPTCHA è così alto che il numero di parole che digitalizziamo ogni giorno è davvero enorme. Sono circa 100 milioni al giorno, che equivale a circa 2,5 milioni di libri all'anno. E viene tutto fatto una parola alla volta solo grazie a persone che digitano CAPTCHA su Internet. (Applausi)
(Applause)
Ora naturalmente,
Now, of course, since we're doing so many words per day, funny things can happen. This is especially true because now we're giving people two randomly chosen English words next to each other. So funny things can happen. For example, we presented this word. It's the word "Christians"; there's nothing wrong with it. But if you present it along with another randomly chosen word, bad things can happen. So we get this.
visto che facciamo così tante parole al giorno, capitano cose divertenti. E questo è vero anche perché diamo alle persone due parole inglesi casuali una accanto all'altra. Possono capitare cose divertenti. Per esempio, abbiamo presentato questa parola. È la parola "Cristiani"; non c'è niente di sbagliato. Ma se la presentate insieme ad un'altra parola casuale, possono capitare cose brutte. Otteniamo questo. (Testo: cattivi cristiani)
[bad Christians]
Ma è anche peggio, perché il sito dove veniva mostrato
But it's even worse, because the website where we showed this actually happened to be called The Embassy of the Kingdom of God.
in realtà si chiamava Ambasciata del Regno di Dio. (Risate)
(Laughter)
Ops.
Oops.
(Risate)
(Laughter)
Eccone un'altro bruttissimo.
Here's another really bad one. JohnEdwards.com
JohnEdwards.com (Testo: Dannato liberale)
[Damn liberal]
(Laughter)
(Risate)
So we keep on insulting people left and right everyday. Of course, we're not just insulting people. Here's the thing. Since we're presenting two randomly chosen words, interesting things can happen. So this actually has given rise to a really big Internet meme that tens of thousands of people have participated in, which is called CAPTCHA art. I'm sure some of you have heard about it. Here's how it works. Imagine you're using the Internet and you see a CAPTCHA that you think is somewhat peculiar, like this CAPTCHA.
Continuiamo a insultare la gente a destra e a sinistra ogni giorno. Naturalmente, non stiamo solo insultando persone. Vedete, da quando proponiamo due parole scelte casualmente, possono capitare cose interessanti. In realtà tutto questo ha dato luogo ad un grande fenomeno su Internet a cui hanno partecipato migliaia di persone, che si chiama CAPTCHA art. Sono sicuro che qualcuno di voi ne ha sentito parlare. Ecco come funziona. Immaginate di utilizzare Internet e vedete un CAPTCHA che pensate sia peculiare, come questo CAPTCHA. (Testo: tostapane invisibile)
[invisible toaster]
Tutto quello che dovete fare è catturare la schermata.
What you're supposed to do is you take a screenshot of it. Then of course, you fill out the CAPTCHA because you help us digitize a book. But first you take a screenshot and then you draw something that is related to it.
Poi naturalmente, inserite il CAPTCHA perché ci aiutate a digitalizzare un libro. Ma poi, prima catturate la schermata, e poi disegnate qualcosa che abbia un nesso.
(Laughter)
(Risate)
That's how it works.
Ecco come funziona.
(Laughter)
Ce ne sono decine di migliaia.
There are tens of thousands of these. Some of them are very cute.
Qualcuno è veramente delizioso. (Testo: afferrato)
[clenched it]
(Risate)
(Laughter)
Qualcuno è divertente.
Some of them are funnier.
(Testo: fondatori impietriti)
[stoned Founders]
(Laughter)
(Risate)
And some of them, like paleontological shvisle ...
E qualcuno,
(Laughter)
come "certezza paleontologica",
they contain Snoop Dogg.
contiene Snoop Dogg.
(Laughter)
(Risate)
OK, so this is my favorite number of reCAPTCHA. So this is the favorite thing that I like about this whole project. This is the number of distinct people that have helped us digitize at least one word out of a book through reCAPTCHA: 750 million, a little over 10 percent of the world's population, has helped us digitize human knowledge. And it is numbers like these that motivate my research agenda. So the question that motivates my research is the following: If you look at humanity's large-scale achievements, these really big things that humanity has gotten together and done historically -- like, for example, building the pyramids of Egypt or the Panama Canal or putting a man on the Moon -- there is a curious fact about them, and it is that they were all done with about the same number of people. It's weird; they were all done with about 100,000 people. And the reason for that is because, before the Internet, coordinating more than 100,000 people, let alone paying them, was essentially impossible. But now with the Internet, I've just shown you a project where we've gotten 750 million people to help us digitize human knowledge. So the question that motivates my research is, if we can put a man on the Moon with 100,000, what can we do with 100 million?
Ok, questo è il mio numero preferito di reCAPTCHA. Questa è la cosa che preferisco di questo progetto. Questo è il numero di utenti unici che hanno aiutato a digitalizzare almeno una parola di un libro con reCAPTCHA: 750 milioni, che è un po' più del 10% della popolazione mondiale, che ci ha aiutato a digitalizzare le conoscenze dell'uomo. E sono numeri come questi che danno la motivazione per pianificare la mia ricerca. La domanda che motiva la mia ricerca è la seguente: Se guardate le conquiste dell'umanità su larga scala, sono cose veramente grandi che l'umanità ha fatto e messo insieme storicamente -- come per esempio, costruire le piramidi d'Egitto o il Canale di Panama o mandare l'uomo sulla luna -- c'è un fatto curioso riguardo a queste imprese, cioè che sono state realizzate con circa lo stesso numero di persone. È strano; tutte sono state fatte con circa 100 000 persone. E il motivo è che, prima di Internet, coordinare più di 100 000 persone, senza contare la remunerazione, era sostanzialmente impossibile. Ma ora con Internet, vi ho appena mostrato un progetto dove abbiamo coinvolto 750 milioni di persone per aiutare a digitalizzare la conoscenza umana. Quindi la domanda che motiva la mia ricerca è, se possiamo mandare l'uomo sulla luna con 100 000 persone, cosa possiamo fare con 100 milioni?
So based on this question, we've had a lot of different projects that we've been working on. Let me tell you about one that I'm most excited about. This is something that we've been semiquietly working on for the last year and a half or so. It hasn't yet been launched. It's called Duolingo. Since it hasn't been launched, shhh!
Basandomi su questa domanda, abbiamo avuto tanti progetti diversi su cui abbiamo lavorato. Fatemi raccontare di uno dei progetti che più mi esalta. È una cosa su cui abbiamo lavorato silenziosamente nell'ultimo anno e mezzo o giù di lì. Non è ancora stato lanciato. Si chiama Duolingo. Visto che non è ancora stato lanciato, shhhh!
(Laughter)
(Risate)
Yeah, I can trust you'll do that. So this is the project. Here's how it started. It started with me posing a question to my graduate student, Severin Hacker. OK, that's Severin Hacker. So I posed the question to my graduate student. By the way, you did hear me correctly; his last name is Hacker.
Sì, mi fido di voi. Questo è il progetto. Ecco come è cominciato. È cominciato quando ho posto una domanda a un mio studente laureando, Severin Hacker. Ok, questo è Severin Hacker. Allora, ho fatto una domanda al mio studente. A proposito, mi avete sentito bene; il suo cognome è Hacker.
(Laughter)
Allora, gli ho fatto questa domanda:
So I posed this question to him: How can we get 100 million people translating the web into every major language for free? There's a lot of things to say about this question. First of all, translating the web. Right now, the web is partitioned into multiple languages. A large fraction of it is in English. If you don't know English, you can't access it. But there's large fractions in other different languages, and if you don't know them, you can't access it. So I would like to translate all of the web, or at least most of it, into every major language. That's what I would like to do.
Come riusciamo a portare 100 milioni di persone a tradurre il Web in tutte le principali lingue gratuitamente? Ok, ci sono molte cose da dire su questa domanda. Prima di tutto, tradurre il Web. Oggi il Web si divide in molte lingue diverse. Una larga parte è in Inglese. Se non sapete l'Inglese, non potete accedervi. Ma una larga parte è in altre lingue, e se non sapete queste lingue, non potete avere accesso. Vorrei quindi tradurre tutto il Web, o almeno la maggior parte del Web, in tutte le principali lingue. Quindi questo è quello che vorrei fare.
Now, some of you may say, why can't we use computers to translate? Machine translation is starting to translate some sentences here and there. Why can't we use it to translate the web? The problem with that is it's not yet good enough and it probably won't be for the next 15 to 20 years. It makes a lot of mistakes. Even when it doesn't, since it makes so many mistakes, you don't know whether to trust it or not.
Qualcuno di voi potrebbe dire, perché non possiamo usare i computer per tradurlo? Perché non possiamo usare la traduzione automatica? La traduzione automatica odierna sta cominciando a tradurre alcune frasi qua e là. Perché non possiamo usarla per tradurre tutto il Web? Il problema è che non ancora abbastanza accurata e probabilmente non lo sarà per il prossimi 15 o 20 anni. Fa molti errori. Anche quando non fa errori, visto che fa così tanti errori, non sai mai se fidarti o meno.
So let me show you an example of something that was translated with a machine. Actually, it was a forum post. It was somebody who was trying to ask a question about JavaScript. It was translated from Japanese into English. So I'll just let you read. This person starts apologizing for the fact that it's translated with a computer. So the next sentence is going to be the preamble to the question. So he's just explaining something. Remember, it's a question about JavaScript.
Fatemi fare un esempio di una cosa che è stata tradotta con un computer. In realtà è un post in un forum. È qualcuno che stava cercando di chiedere una cosa su JavaScript. È stato tradotto dal Giapponese all'Inglese. Vi lascio leggere. Questa persona comincia a scusarsi per il fatto che è tradotto con un computer. La frase successiva sarà il preambolo alla domanda. Sta solo spiegando qualcosa. Ricordatevi, è una domanda su JavaScript.
[At often, the goat-time install a error is vomit.]
(Testo: Spesso, il tempo-capra installa un errore è vomito).
(Laughter)
(Risate)
Then comes the first part of the question.
Poi arriva la prima parte della domanda.
[How many times like the wind, a pole, and the dragon?]
(Testo: Quante volte come il vento, un palo, e il drago?)
(Laughter)
(Risate)
Then comes my favorite part of the question.
Poi arriva la mia parte preferita della domanda.
[This insult to father's stones?]
(Testo: Questo insulto alle pietre del padre?)
(Laughter)
(Risate)
And then comes the ending, which is my favorite part of the whole thing.
E poi arriva la fine, che è il mio pezzo preferito. (Testo: Per favore perdonami per la tua stupidità. Ci sono molti grazie.)
[Please apologize for your stupidity. There are a many thank you.]
(Risate)
(Laughter)
Ok, quindi la traduzione automatica, non è ancora abbastanza buona.
OK, so computer translation, not yet good enough. So back to the question. So we need people to translate the whole web. So now the next question you may have is, well, why can't we just pay people to do this? We could pay professional translators to translate the whole web. We could do that. Unfortunately, it would be extremely expensive. For example, translating a tiny fraction of the whole web, Wikipedia, into one other language, Spanish. OK? Wikipedia exists in Spanish, but it's very small compared to the size of English. It's about 20 percent of the size of English. If we wanted to translate the other 80 percent into Spanish, it would cost at least 50 million dollars -- and this is even at the most exploited, outsourcing country out there. So it would be very expensive. So what we want to do is, we want to get 100 million people translating the web into every major language for free.
Tornando alla domanda. Abbiamo bisogno di persone che traducano tutto il Web. La prossima domanda che potreste farmi è, perché non si possono semplicemente pagare le persone per farlo? Potremmo pagare traduttori professionisti per tradurre tutto il Web. Potremmo farlo. Sfortunatamente, sarebbe estremamente costoso. Per esempio la traduzione di una piccolissima frazione del Web, Wikipedia, in un'altra lingua, lo Spagnolo. Wikipedia esiste in Spagnolo, ma è molto piccola rispetto all'Inglese. È circa il 20% di quella inglese. Se volessimo tradurre il restante 80% in Spagnolo, costerebbe almeno 50 milioni di dollari -- e questo anche al costo del paese più competitivo che ci sia. Quindi sarebbe molto costoso. Quello che vogliamo fare è portare 100 milioni di persone a tradurre il Web in tutte le principali lingue gratuitamente.
If this is what you want to do, you quickly realize you're going to run into two big hurdles, two big obstacles. The first one is a lack of bilinguals. So I don't even know if there exists 100 million people out there using the web who are bilingual enough to help us translate. That's a big problem. The other problem you're going to run into is a lack of motivation. How are we going to motivate people to actually translate the web for free? Normally, you have to pay people to do this. So how are we going to motivate them to do it for free? When we were starting to think about this, we were blocked by these two things. But then we realized, there's a way to solve both these problems with the same solution. To kill two birds with one stone. And that is to transform language translation into something that millions of people want to do and that also helps with the problem of lack of bilinguals, and that is language education.
Se questo è quello che volete fare, vi accorgete rapidamente che andrete incontro a due ostacoli, due grossi ostacoli. Il primo è la carenza di persone bilingui. Non so neanche se esistano 100 milioni di persone là fuori che usano il Web abbastanza bilingui da aiutarci a tradurre. È un grosso problema. L'altro problema con cui vi scontrerete è la mancanza di motivazione. Come riusciremo a motivare le persone a tradurre veramente il Web gratuitamente? Normalmente, si pagano persone per farlo. Come faremo a motivarle per farlo gratuitamente? Quando abbiamo cominciato a pensarci, ci siamo bloccati a causa di queste due cose. Ma poi ci siamo resi conto che in realtà c'è un modo per risolvere entrambi i problemi con la stessa soluzione. C'è un modo per prendere due piccioni con una fava. Ed è trasformare la traduzione di una lingua in qualcosa che milioni di persone vogliono fare, e che risolve anche il problema della carenza di bilingui, ed è l'apprendimento della lingua.
So it turns out that today, there are over 1.2 billion people learning a foreign language. People really want to learn a foreign language. And it's not just because they're being forced to do so in school. In the US alone, there are over five million people who have paid over $500 for software to learn a new language. So people really want to learn a new language. So what we've been working on for the last year and a half is a new website -- it's called Duolingo -- where the basic idea is people learn a new language for free while simultaneously translating the web. And so basically, they're learning by doing.
Abbiamo scoperto che oggi ci sono più di 1,2 miliardi di persone che imparano una lingua straniera. La gente vuole veramente imparare una lingua straniera. E non solo perché sono costrette a farlo a scuola. Per esempio, solo negli Stati Uniti, ci sono più di cinque milioni di persone che hanno pagato più di 500$ in software per imparare una lingua. La gente vuole quindi davvero imparare una nuova lingua. Quindi quello su cui abbiamo lavorato l'ultimo anno e mezzo è un nuovo sito web -- si chiama Duolingo -- dove l'idea di base è che la gente impara una nuova lingua gratuitamente mentre contemporaneamente traduce il Web. E quindi sostanzialmente si impara facendo.
So the way this works is whenever you're a just a beginner, we give you very simple sentences. There's a lot of very simple sentences on the web. We give you very simple sentences along with what each word means. And as you translate them and as you see how other people translate them, you start learning the language. And as you get more advanced, we give you more complex sentences to translate. But at all times, you're learning by doing.
Funziona in questo modo, se siete principianti, vi diamo delle frasi molto, molto semplici. Ovviamente nel Web ci sono tantissime frasi semplici. Vi diamo frasi molto, molto semplici insieme al significato di ciascuna parola. E mentre le traducete e vedete come le traducono altre persone, cominciate a imparare la lingua. E man mano che migliorate vi diamo frasi sempre più complesse da tradurre. Ma in ogni momento, imparate facendo. La cosa pazzesca di questo metodo
Now, the crazy thing about this method is that it actually really works. People are really learning a language. We're mostly done building it and now we're testing it. People really can learn a language with it. And they learn it about as well as the leading language learning software. So people really do learn a language. And not only do they learn it as well, but actually it's more interesting. Because with Duolingo, people are learning with real content. As opposed to learning with made-up sentences, people are learning with real content, which is inherently interesting. So people really do learn a language.
è che funziona veramente. Prima di tutto, la gente impara veramente una lingua. Abbiamo quasi finito di costruirlo e lo stiamo testando. La gente può veramente impararci una lingua. E la imparano bene quanto potrebbero fare con il miglior software di lingue. La gente impara quindi veramente una lingua. E non solo imparano, ma la cosa è ancora più interessante. Perché con Duolingo, la gente impara con contenuti reali. Contrariamente all'apprendimento con frasi precostruite, la gente impara con contenuti reali, il che è realmente interessante. Quindi la gente impara veramente una lingua.
But perhaps more surprisingly, the translations that we get from people using the site, even though they're just beginners, the translations that we get are as accurate as those of professional language translators, which is very surprising. So let me show you one example. This is a sentence that was translated from German into English. The top is the German. The middle is an English translation that was done by a professional translator who we paid 20 cents a word for this translation. And the bottom is a translation by users of Duolingo, none of whom knew any German before they started using the site. If you can see, it's pretty much perfect. Of course, we play a trick here to make the translations as good as professional language translators. We combine the translations of multiple beginners to get the quality of a single professional translator.
Ma la cosa ancora più sorprendente è che le traduzioni che riceviamo dalla gente che usa il sito, anche se sono solo principianti, le traduzioni che riceviamo sono accurate quanto quelle di traduttori professionisti, il che è veramente sorprendente. Lasciate che vi mostri un esempio. Questa è una frase tradotta dal Tedesco all'Inglese. In alto c'è il Tedesco. In mezzo la traduzione in Inglese fatta da un traduttore inglese professionista che abbiamo pagato 20 centesimi a parola per la traduzione. E in basso la traduzione degli utenti di Duolingo, nessuno dei quali sapeva il Tedesco prima di iniziare a usare il sito. Potete vedere, è praticamente perfetta. Ora ovviamente c'è un trucco qui per rendere le traduzioni buone quanto quelle di traduttori professionisti. Combiniamo le traduzioni di più principianti per ottenere la qualità di un singolo traduttore professionista.
Now, even though we're combining the translations, the site actually can translate pretty fast. So let me show you, this is our estimates of how fast we could translate Wikipedia from English into Spanish. Remember, this is 50 million dollars' worth of value. So if we wanted to translate Wikipedia into Spanish, we could do it in five weeks with 100,000 active users. And we could do it in about 80 hours with a million active users. Since all the projects my group has worked on so far have gotten millions of users, we're hopeful that we'll be able to translate extremely fast.
Anche se stiamo combinando le traduzioni, il sito in realtà può tradurre abbastanza rapidamente. Lasciate che vi mostri, questa è la nostra stima sulla velocità a cui potremmo tradurre Wikipedia dall'Inglese allo Spagnolo. Ricordatevi, un costo di 50 milioni di dollari. Quindi se volessimo tradurre Wikipedia in Spagnolo, potremmo farlo in cinque settimane con 100 000 utenti attivi. E potremmo farlo in circa 80 ore con un milione di utenti attivi. Visto che tutti i progetti su cui ha lavorato il mio gruppo fin'ora hanno avuto milioni di utenti, siamo fiduciosi che saremo in grado di tradurre molto rapidamente con questo progetto.
Now, the thing that I'm most excited about with Duolingo is I think this provides a fair business model for language education. So here's the thing: The current business model for language education is the student pays, and in particular, the student pays Rosetta Stone 500 dollars.
La cosa che più mi emoziona di Duolingo è che credo fornisca un corretto modello di business per l'apprendimento delle lingue. Quindi ecco il punto: Il modello di business corrente per l'apprendimento delle lingue è che gli studenti paghino, e in particolare, lo studente paga 500 dollari per RosettaStone.
(Laughter)
(Risate)
That's the current business model. The problem with this business model is that 95 percent of the world's population doesn't have 500 dollars. So it's extremely unfair towards the poor. This is totally biased towards the rich. Now, see, in Duolingo, because while you learn, you're actually creating value, you're translating stuff -- which, for example, we could charge somebody for translations, so this is how we could monetize this. Since people are creating value while they're learning, they don't have to pay with their money, they pay with their time. But the magical thing here is that is time that would have had to have been spent anyways learning the language. So the nice thing about Duolingo is, I think, it provides a fair business model -- one that doesn't discriminate against poor people.
Questo è il modello di business corrente. Il problema con questo modello di business è che il 95% della popolazione mondiale non ha 500 dollari. Quindi è estremamente ingiusto nei confronti dei poveri. È completamente sbilanciato a favore dei ricchi. Invece guardate, in Duolingo siccome mentre imparate di fatto create valore, state traducendo testi -- che per esempio, potrebbe essere assegnata a qualcuno per la traduzione. Quindi ecco come potremmo monetizzare. Visto che la gente crea valore mentre impara, non deve pagare con denaro, bensì con il proprio tempo. Ma la magia qui è che pagano con il loro tempo, ma quello è tempo che avrebbero comunque dedicato ad imparare la lingua. La cosa bella di Duolingo è che credo fornisca un modello di business equo -- che non discrimina le persone povere. Ecco qua il sito. Grazie.
So here's the site. Thank you.
(Applausi)
(Applause)
Ecco qua il sito.
We haven't yet launched, but if you go there, you can sign up to be part of our private beta, which is probably going to start in three or four weeks. We haven't yet launched it.
Non l'abbiamo ancora lanciato, ma se volete, potete iscrivervi per fare parte della versione beta, che partirà tra 3 o 4 settimane. Non abbiamo ancora lanciato Duolingo.
By the way, I'm the one talking here, but Duolingo is the work of a really awesome team,
A proposito, io sono quello che ne parla, ma in realtà Duolingo è il lavoro di un gruppo fantastico, alcuni sono qui.
some of whom are here. So thank you.
Quindi grazie.
(Applause)
(Applausi)