I work on helping computers communicate about the world around us. There are a lot of ways to do this, and I like to focus on helping computers to talk about what they see and understand. Given a scene like this, a modern computer-vision algorithm can tell you that there's a woman and there's a dog. It can tell you that the woman is smiling. It might even be able to tell you that the dog is incredibly cute. I work on this problem thinking about how humans understand and process the world. The thoughts, memories and stories that a scene like this might evoke for humans. All the interconnections of related situations. Maybe you've seen a dog like this one before, or you've spent time running on a beach like this one, and that further evokes thoughts and memories of a past vacation, past times to the beach, times spent running around with other dogs. One of my guiding principles is that by helping computers to understand what it's like to have these experiences, to understand what we share and believe and feel, then we're in a great position to start evolving computer technology in a way that's complementary with our own experiences.
Tôi đang làm việc để giúp máy tính có thể "giao tiếp" với thế giới. Có rất nhiều phương pháp để làm điều đó, tôi muốn tập trung vào khía cạnh khiến máy tính có thể diễn đạt điều mà chúng đang thấy và hiểu. Với một bức ảnh thế này, một thuật toán nhận diện hình ảnh hiện đại có khả năng nhận biết đâu là cô gái và đâu là chú chó. Nó sẽ cho bạn biết rằng cô gái đang cười. Thậm chí nó còn nói với bạn rằng chú chó đó cực kỳ dễ thương. Trong quá trình làm việc, tôi suy nghĩ nhiều về cách con người nhận thức thế giới xung quanh. Những suy nghĩ, ký ức, hay kỷ niệm đều được con người gọi đến khi cần thiết. Tất cả các mối liên hệ với các tình huống cụ thể có liên quan. Có thể bạn đã từng thấy chú chó này rồi, hoặc bạn đã từng chạy bộ dọc bờ biển giống thế này, và điều đó gợi nhớ cho bạn những suy nghĩ và ký ức của kỳ nghỉ trước đây, những lần ra biển, những lần chạy bộ cùng chú chó cưng của mình. Một trong các mục tiêu tôi luôn hướng tới là giúp máy tính hiểu được "cảm giác" khi trải qua những điều như vậy, hiểu được cách chúng ta chia sẻ, tin tưởng, cảm nhận lẫn nhau, điều đó giúp công nghệ máy tính tiến hoá mạnh mẽ tới mức chúng có thể hỗ trợ cho những trải nghiệm của chúng ta.
So, digging more deeply into this, a few years ago I began working on helping computers to generate human-like stories from sequences of images. So, one day, I was working with my computer to ask it what it thought about a trip to Australia. It took a look at the pictures, and it saw a koala. It didn't know what the koala was, but it said it thought it was an interesting-looking creature. Then I shared with it a sequence of images about a house burning down. It took a look at the images and it said, "This is an amazing view! This is spectacular!" It sent chills down my spine. It saw a horrible, life-changing and life-destroying event and thought it was something positive. I realized that it recognized the contrast, the reds, the yellows, and thought it was something worth remarking on positively. And part of why it was doing this was because most of the images I had given it were positive images. That's because people tend to share positive images when they talk about their experiences. When was the last time you saw a selfie at a funeral?
Tìm hiểu sâu hơn về vấn đề này, vài năm trước, tôi bắt đầu giúp máy tính tạo ra các câu chuyện "như người kể" từ một chuỗi những bức ảnh. Một ngày kia, tôi đang cố gắng "hỏi" chiếc máy của mình về cảm xúc của nó khi được tới Úc. Nó nhìn vào một bức ảnh, trong đó có một chú gấu koala. Nó không biết gì về loài gấu đó, nhưng nó cho rằng đó là một sinh vật có ngoại hình khá hay ho. Sau đó, tôi cho nó xem một loạt ảnh về một căn nhà đang đổ sập trong đám cháy. Nó nhìn vào những bức ảnh đó và nói, "Một quang cảnh tuyệt vời ngoài sức tưởng tượng!" Điều đó làm tôi rợn người. Nó đang thấy một sự kiện khủng khiếp, khiến mạng sống con người bị đe doạ, nhưng vẫn nghĩ đó là điều tốt đẹp. Tôi nhận ra rằng nó đã để ý tới sự tương phản màu sắc, các gam màu đỏ và vàng, và khiến nó cho rằng đó là một sự kiện tốt đẹp. Một phần lý do nó nghĩ như vậy vì hầu hết những bức ảnh tôi cho nó xem đều nói lên sự tốt đẹp. Lý do vì hầu hết mọi người đều chia sẽ những tấm ảnh tốt đẹp khi họ nói về trải nghiệm của chính mình. Bạn có nhớ lần cuối bạn thấy ai đó "selfie" tại đám tang?
I realized that, as I worked on improving AI task by task, dataset by dataset, that I was creating massive gaps, holes and blind spots in what it could understand. And while doing so, I was encoding all kinds of biases. Biases that reflect a limited viewpoint, limited to a single dataset -- biases that can reflect human biases found in the data, such as prejudice and stereotyping. I thought back to the evolution of the technology that brought me to where I was that day -- how the first color images were calibrated against a white woman's skin, meaning that color photography was biased against black faces. And that same bias, that same blind spot continued well into the '90s. And the same blind spot continues even today in how well we can recognize different people's faces in facial recognition technology. I though about the state of the art in research today, where we tend to limit our thinking to one dataset and one problem. And that in doing so, we were creating more blind spots and biases that the AI could further amplify.
Tôi nhận ra điều đó khi cố gắng cải thiện AI từng chút một, trong mỗi công việc, với các bộ dữ liệu khác nhau, tôi đang tạo ra những lỗ hổng lớn, những "điểm mù" làm hạn chế những điều AI có thể hiểu được. Khi làm vậy, tôi đã khiến AI suy nghĩ theo lối mòn (bias). Điều đó phản ánh một điểm nhìn hạn hẹp, do chỉ được huấn luyện với một bộ dữ liệu duy nhất. Lối mòn của dữ liệu cũng phản ánh lối mòn trong suy nghĩ con người, biểu hiện qua thành kiến và sự đánh đồng. Tôi nghĩ lại về cách công nghệ thay đổi và tiến hoá, điều đó giúp tôi đứng ở đây hôm nay -- những bức ảnh màu đầu tiên phản ứng rất tốt với màu da của người da trắng, có nghĩa rằng ảnh màu đã vô tình "chống lại" người da đen. Điểm nhìn hạn hẹp dẫn đến "điểm mù" đó vẫn tiếp tục cho đến những năm 1990. Một điểm mù tương tự vẫn kéo dài cho đến ngày nay về khả năng nhận diện những khuôn mặt khác nhau trong công nghệ nhận dạng khuôn mặt. Tôi nghĩ tới những nghiên cứu mới nhất hiện nay, khi ta bó hẹp suy nghĩ của mình trong một bộ dữ liệu và một vấn đề. Bằng việc làm như vậy, ta đã tạo ra thêm nhiều điểm mù và lối mòn, điều đó được AI nhân thêm bội phần.
I realized then that we had to think deeply about how the technology we work on today looks in five years, in 10 years. Humans evolve slowly, with time to correct for issues in the interaction of humans and their environment. In contrast, artificial intelligence is evolving at an incredibly fast rate. And that means that it really matters that we think about this carefully right now -- that we reflect on our own blind spots, our own biases, and think about how that's informing the technology we're creating and discuss what the technology of today will mean for tomorrow.
Khi đó, tôi nhận ra ta cần suy nghĩ sâu hơn về bộ mặt của những công nghệ hiện nay trong năm hay mười năm nữa. Con người tiến hoá rất chậm, theo thời gian, họ trở nên thích nghi hơn khi tương tác với người khác và với môi trường. Ngược lại, AI tiến hoá với tốc độ không tưởng. Điều đó thực sự quan trọng nếu chúng ta nghĩ kỹ -- chúng chính là những "điểm mù" của ta, những lối mòn cũ kỹ của ta, hãy nghĩ đến tầm ảnh hưởng của nó đến thứ công nghệ ta đang tạo ra hôm nay, và bàn đến ý nghĩa của chúng đối với tương lai ta sau này.
CEOs and scientists have weighed in on what they think the artificial intelligence technology of the future will be. Stephen Hawking warns that "Artificial intelligence could end mankind." Elon Musk warns that it's an existential risk and one of the greatest risks that we face as a civilization. Bill Gates has made the point, "I don't understand why people aren't more concerned." But these views -- they're part of the story. The math, the models, the basic building blocks of artificial intelligence are something that we call access and all work with. We have open-source tools for machine learning and intelligence that we can contribute to. And beyond that, we can share our experience. We can share our experiences with technology and how it concerns us and how it excites us. We can discuss what we love. We can communicate with foresight about the aspects of technology that could be more beneficial or could be more problematic over time.
Các giám đốc điều hành và nhà khoa học đã cho biết những gì họ nghĩ về cách mà công nghệ AI hoạt động trong tương lai. Stephen Hawking đã cảnh báo rằng "Trí tuệ nhân tạo có thể là điểm kết thúc của loài người." Elon Musk cảnh báo đó là mối nguy hại liên quan đến sự tồn vong và là một trong những hiểm hoạ lớn nhất nền văn minh này phải đối mặt. Bill Gates thì cho rằng, "Tôi không hiểu nổi vì sao người ta chẳng lo lắng gì cả." Nhưng các quan điểm này -- chúng là một phần của bức tranh lớn hơn. Những mô hình toán học, những viên gạch nền tảng của trí tuệ nhân tạo đều là những thứ chúng tôi thường xuyên làm việc cùng. Ta có những nền tảng mã nguồn mở dành riêng cho Học máy hoặc AI mà ai cũng có thể đóng góp vào. Xa hơn nữa, thông qua đó, ta có thể chia sẻ trải nghiệm của mình. Ta có thể chia sẻ những điều mà công nghệ khiến ta bận tâm và cách chúng làm ta thích thú. Ta có thể nói về thứ ta yêu quý. Ta có thể đưa ra những dự đoán về những khía cạnh công nghệ giúp ích con người hoặc những vấn đề cần giải quyết.
If we all focus on opening up the discussion on AI with foresight towards the future, this will help create a general conversation and awareness about what AI is now, what it can become and all the things that we need to do in order to enable that outcome that best suits us. We already see and know this in the technology that we use today. We use smart phones and digital assistants and Roombas. Are they evil? Maybe sometimes. Are they beneficial? Yes, they're that, too. And they're not all the same. And there you already see a light shining on what the future holds. The future continues on from what we build and create right now. We set into motion that domino effect that carves out AI's evolutionary path.
Nếu chúng ta đều cởi mở trong vấn đề chia sẻ về AI với tầm nhìn tương lai rõ ràng, điều đó sẽ chúng ta tạo nên một nền tảng kiến thức về bản chất của AI hiện nay, sự phát triển của nó trong tương lai, và những điều ta phải làm để đảm bảo một kết quả tốt nhất cho chúng ta. Ta đã biết rõ những điều đó qua việc sử dụng các công nghệ ngày nay. Ta dùng điện thoại thông minh, trợ lý ảo và những con robot biết dọn phòng. Điều đó có xấu xa không? Cũng tuỳ lúc. Chúng có ích cho ta không? Cũng tuỳ lúc thôi. Và không phải trường hợp nào cũng như nhau. Khi đó, bạn đã thấy những tia sáng từ tương lai tới. Tương lai sẽ tiếp diễn từ những điều chúng ta đang xây dựng hôm nay. Giống như hiệu ứng domino, ta vẽ nên lộ trình phát triển và tiến hoá của AI.
In our time right now, we shape the AI of tomorrow. Technology that immerses us in augmented realities bringing to life past worlds. Technology that helps people to share their experiences when they have difficulty communicating. Technology built on understanding the streaming visual worlds used as technology for self-driving cars. Technology built on understanding images and generating language, evolving into technology that helps people who are visually impaired be better able to access the visual world. And we also see how technology can lead to problems. We have technology today that analyzes physical characteristics we're born with -- such as the color of our skin or the look of our face -- in order to determine whether or not we might be criminals or terrorists. We have technology that crunches through our data, even data relating to our gender or our race, in order to determine whether or not we might get a loan. All that we see now is a snapshot in the evolution of artificial intelligence. Because where we are right now, is within a moment of that evolution. That means that what we do now will affect what happens down the line and in the future.
Những gì ta làm bây giờ sẽ quyết định AI tương lai. Những công nghệ giúp ta được sống trong thực tế tăng cường, đem tới cho chúng ta sự sống từ xa xưa. Công nghệ giúp con người chia sẻ những trải nghiệm của mình khi họ gặp khó khăn trong việc giao tiếp. Hay công nghệ chuyên về thu thập và xử lý thế giới hình ảnh, được dùng trong các sản phẩm như xe tự lái. Công nghệ chuyên về xử lý hình ảnh và sinh ra ngôn ngữ, được phát triển để hỗ trợ những người gặp vấn đề về thị lực, hỗ trợ họ hiểu rõ hơn về những hình ảnh quanh mình. Và ta cũng thấy được rằng công nghệ tạo ra những vấn đề mới. Ngày nay, ta có những công nghệ phân tích chính xác ngoại hình của con người, ví dụ như màu da hay các đường nét trên khuôn mặt, nhằm dự đoán liệu ta có nguy cơ trở thành tội phạm hoặc khủng bố được không. Ta có những công nghệ xử lý dữ liệu cá nhân của người khác, thậm chí chúng kiểm tra dữ liệu về giới tính và chủng tộc, nhằm quyết định xem liệu ta có được vay tiền hay không. Mọi thứ ta thấy bây giờ chỉ là một mảnh ghép nhỏ trong sự tiến hoá của AI. Bởi vì hiện tại ta đang sống vẫn nằm trong quá trình tiến hoá đó. Điều đó có nghĩa những điều ta làm bây giờ sẽ ảnh hưởng sâu rộng đến hiện tại và đến tương lai.
If we want AI to evolve in a way that helps humans, then we need to define the goals and strategies that enable that path now. What I'd like to see is something that fits well with humans, with our culture and with the environment. Technology that aids and assists those of us with neurological conditions or other disabilities in order to make life equally challenging for everyone. Technology that works regardless of your demographics or the color of your skin. And so today, what I focus on is the technology for tomorrow and for 10 years from now.
Nếu ta muốn AI tiến hoá theo hướng hỗ trợ loài người, ta cần định nghĩa rõ ràng mục tiêu và các phương pháp cụ thể để vạch ra con đường đó. Tôi muốn thấy một thứ phù hợp nhất với con người, với văn hoá của chúng ta và với môi trường. Công nghệ cần hỗ trợ những người gặp vấn đề về thần kinh hay bất cứ khuyết tật nào khác nhằm tạo ra một cuộc sống bình đẳng cho tất cả mọi người. Công nghệ cần được áp dụng bất kể ngoại hình hay màu da của bạn thế nào. Điều tôi muốn tập trung đến là về công nghệ cho ngày mai và cho mười năm nữa.
AI can turn out in many different ways. But in this case, it isn't a self-driving car without any destination. This is the car that we are driving. We choose when to speed up and when to slow down. We choose if we need to make a turn. We choose what the AI of the future will be. There's a vast playing field of all the things that artificial intelligence can become. It will become many things. And it's up to us now, in order to figure out what we need to put in place to make sure the outcomes of artificial intelligence are the ones that will be better for all of us.
AI sẽ biến thể theo nhiều cách khác nhau. Nhưng trong tình huống này, nó không chỉ là một chiếc xe tự lái mà không biết điểm đích. Nó giống như chiếc xe ta đang lái hằng ngày. Ta sẽ quyết định lúc nào nên tăng tốc và giảm tốc. Ta quyết định lúc nào nên rẽ. Ta quyết định số phận của AI tương lai. Có vô vàn bộ mặt mà trí tuệ nhân tạo có thể biến thành. Chúng sẽ có mặt trong nhiều thứ. Điều đó phụ thuộc vào chúng ta, ta cần tìm hiểu những gì cần thực hiện ngay hôm nay để tìm đường đi đúng đắn cho trí tuệ nhân tạo, một con đường đi giúp tất cả chúng ta tốt hơn.
Thank you.
Cám ơn.
(Applause)
(Vỗ tay)