Our emotions influence every aspect of our lives, from our health and how we learn, to how we do business and make decisions, big ones and small. Our emotions also influence how we connect with one another. We've evolved to live in a world like this, but instead, we're living more and more of our lives like this -- this is the text message from my daughter last night -- in a world that's devoid of emotion. So I'm on a mission to change that. I want to bring emotions back into our digital experiences.
Cảm xúc của chúng ta ảnh hưởng tới mọi khía cạnh của cuộc sống, từ sức khoẻ và học tập, cho đến làm thế nào để kinh doanh và ra các quyết định, những điều lớn lao và nhỏ bé. Cảm xúc của chúng ta cũng ảnh hưởng tới cách mà chúng ta giao tiếp với người khác. Chúng ta đã tiến hoá để sống trong một thế giới như thế này, nhưng thay vào đó, chúng ta đang ngày càng sống giống như thế này -- đây là tin nhắn từ con gái tôi tối qua-- trong một thế giới mà ở đó không có cảm xúc Vì thế tôi có nhiệm vụ thay đổi điều đó. Tôi muốn mang cảm xúc trở lại trong các trải nghiệm trên thiết bị điện tử.
I started on this path 15 years ago. I was a computer scientist in Egypt, and I had just gotten accepted to a Ph.D. program at Cambridge University. So I did something quite unusual for a young newlywed Muslim Egyptian wife: With the support of my husband, who had to stay in Egypt, I packed my bags and I moved to England. At Cambridge, thousands of miles away from home, I realized I was spending more hours with my laptop than I did with any other human. Yet despite this intimacy, my laptop had absolutely no idea how I was feeling. It had no idea if I was happy, having a bad day, or stressed, confused, and so that got frustrating. Even worse, as I communicated online with my family back home, I felt that all my emotions disappeared in cyberspace. I was homesick, I was lonely, and on some days I was actually crying, but all I had to communicate these emotions was this. (Laughter) Today's technology has lots of I.Q., but no E.Q.; lots of cognitive intelligence, but no emotional intelligence. So that got me thinking, what if our technology could sense our emotions? What if our devices could sense how we felt and reacted accordingly, just the way an emotionally intelligent friend would? Those questions led me and my team to create technologies that can read and respond to our emotions, and our starting point was the human face.
Tôi đã bắt đầu công việc này từ 15 năm về trước. Tôi mà một nhà khoa học về máy tính ở Ai Cập, và tôi đã được chấp nhận vào chương trình tiến sĩ tại Đại học tổng hợp Cambridge. Vì thế tôi đã làm một số điều không bình thường đối với một người vợ trẻ mới cưới theo đạo hồi ở Ai Cập: Với sự ủng hộ từ chồng tôi, anh đã phải ở lại Ai Cập Tôi đã sắp xếp hành lý và đi tới Anh tại Đại học Cambridge, cách xa nhà hàng nghìn cây số, Tôi đã nhận ra rằng tôi đã dành nhiều thời gian cho cái máy tính xách tay của tôi hơn là giao tiếp với mọi người xung quanh. Cho dù gần gũi như vậy, nhưng cái máy tính của tôi hoàn toàn không biết cảm giác của tôi thế nào Nó không hiểu là tôi hạnh phúc, có một ngày tồi tệ, hoặc căng thẳng, bối rối, và thật là vô dụng. Thậm chí tồi tệ hơn, khi tôi nói chuyện trực tiếp với gia đình của tôi ở nhà, Tôi cảm giác rằng toàn bộ cảm xúc của tôi đã tiêu biến đi trong không gian ảo. Tôi dã nhớ nhà, tôi cảm thấy cô đơn, và vào một số ngày thực sự tôi đã khóc, nhưng cái thứ mà tôi phải dùng để giao tiếp chỉ là những thứ như thế này. (Khán giả cười) Công nghệ hiện này có quá nhiều thứ về IQ, nhưng chưa đề cập tới EQ; có rất nhiều trí tuệ nhân tạo về nhận thức, nhưng không có trí tuệ nhân tạo về cảm xúc. Vì thế điều đó đã khiến tôi suy nghĩ, Điều gì sẽ sảy ra nếu công nghệ có thể cảm nhận được cảm xúc của chúng ta? Điều gì sẽ sảy ra nếu các thiết bị có thể cảm nhận được chúng ta đang cảm thấy thế nào và đáp ứng lại một cách hợp lý, liệu có thể đáp lại theo cách mà một người bạn có cảm xúc? Những câu hỏi này đã dẫn dắt tôi và nhóm của tôi sáng tạo ra các công nghệ mà chúng có thể đọc và đáp ứng lại cảm xúc của chúng ta, và khởi đầu của chúng tôi là từ khuôn mặt của con người.
So our human face happens to be one of the most powerful channels that we all use to communicate social and emotional states, everything from enjoyment, surprise, empathy and curiosity. In emotion science, we call each facial muscle movement an action unit. So for example, action unit 12, it's not a Hollywood blockbuster, it is actually a lip corner pull, which is the main component of a smile. Try it everybody. Let's get some smiles going on. Another example is action unit 4. It's the brow furrow. It's when you draw your eyebrows together and you create all these textures and wrinkles. We don't like them, but it's a strong indicator of a negative emotion. So we have about 45 of these action units, and they combine to express hundreds of emotions.
Vì khuôn mặt của chúng ta là một trong những kênh mạnh mẽ nhất để tất cả chúng ta tạo ra các trạng thái giao tiếp xã hội và cảm xúc, tất cả mọi thứ từ hứng thú, ngạc nhiên, đồng cảm và tò mò. Trong khoa học về cảm xúc, chúng tôi gọi mỗi một chuyển động cơ mặt mà một đơn vị hành động. Vì thế, ví dụ như đơn vị hành động số 12, nó không phải là một bộ phim bom tất của Hollywood, mà thực sự nó là một cái nhếch môi, đây là một thành tố chính của một nụ cười. Mọi người hày làm thử xem nào. Hãy để những nụ cười tiếp tục. Một ví dụ khác là đơn vị hành động số 4, nó có nghĩa là cái nhíu lông mày. Đó là khi bạn kéo lông mày của bạn cùng lúc và bạn đã tạo ra các kết cấu và nếp nhăn này. Chúng ta không thích chúng, nhưng đây là những chỉ điểm mạnh mẽ cho một cảm xúc tiêu cực. Như vậy chúng ta có khoảng 45 đơn vị hành động loại này, và chúng kết hợp với nhau để bộc lộ hàng trăm cảm xúc khác nhau.
Teaching a computer to read these facial emotions is hard, because these action units, they can be fast, they're subtle, and they combine in many different ways. So take, for example, the smile and the smirk. They look somewhat similar, but they mean very different things. (Laughter) So the smile is positive, a smirk is often negative. Sometimes a smirk can make you become famous. But seriously, it's important for a computer to be able to tell the difference between the two expressions.
Dạy cho máy tinhd đọc được những cảm xúc của khuôn mặt này thật khó, bởi vì những đơn vị hành động này, chúng có thể diễn ra rất nhanh, tinh tế, và chúng được kết hợp bằng rất nhiều cách khác nhau, Vì thế thử lấy một ví dụ về nụ cười thoải mái và nụ cười bực bội. Trông chúng có vẻ giống nhau, nhưng thực tế chúng có ý nghĩa rất khác nhau. (Khán giả cười) Trong khi cười thoải mái có ý nghĩa tích cực, thì cười bực bội thường là tiêu cực. Đôi khi cười bực bội có thể khiến bạn trở nên nổi tiếng. Nhưng, rất quan trọng đối với máy tính để chúng có thể đưa ra sự khác biệt giữa 2 cách biểu lộ cảm xúc đo.
So how do we do that? We give our algorithms tens of thousands of examples of people we know to be smiling, from different ethnicities, ages, genders, and we do the same for smirks. And then, using deep learning, the algorithm looks for all these textures and wrinkles and shape changes on our face, and basically learns that all smiles have common characteristics, all smirks have subtly different characteristics. And the next time it sees a new face, it essentially learns that this face has the same characteristics of a smile, and it says, "Aha, I recognize this. This is a smile expression."
Vậy thì làm thế nào để chúng tôi làm được điều đó? Chúng tôi đưa ra các thuật toán cảu chúng tôi với hàng ngàn ví dụ mà chúng ta biết về nụ cười của mọi người, với sự khác nhau về dân tộc, tuổi tác, giới tính, và chúng tôi cũng làm giống như vậy đối với nụ cười bực bội. Và sau đó, phân tích thật kỹ càng, thuật toán đã tìm kiếm toàn bộ các kết cấu và nếp nhăn và các hình dạng thay đổi trên khuôn mặt của chúng ta, và nhận thấy về cơ bản tất cả các nụ cười đều có những đặc tính chung, toàn bộ nhụ cười bực bội có các đặc tính khác biệt. Và với lần sau khi máy tính nhìn vào một khuôn mặt mới, nó có thể nhận ra thực tế là khuôn mặt này có các đặc tính giống với một nụ cười, và nó sẽ nói răng, "Ồ, tôi đã nhận ra điều này. Đây là cách biểu lộ một nụ cười."
So the best way to demonstrate how this technology works is to try a live demo, so I need a volunteer, preferably somebody with a face. (Laughter) Cloe's going to be our volunteer today.
Vậy thì cách tốt nhất để mô tả công nghệ này hoạt động như thế nào là chúng ta thử nghiệm trực tiếp tại đây, nào bây giờ tôi cần một tình nguyện viên, ưu tiên ai đó có một cái mặt. (Khán giả cười) Chị Cloe sẽ là tình nguyện viên của chúng ta hôm nay.
So over the past five years, we've moved from being a research project at MIT to a company, where my team has worked really hard to make this technology work, as we like to say, in the wild. And we've also shrunk it so that the core emotion engine works on any mobile device with a camera, like this iPad. So let's give this a try.
Vì lẽ đó mà trong vòng 5 năm qua, chúng tôi đã chuyển một dự án nghiên cứu tại MIT thành một công ty, mà ở đó nhóm của tôi đã làm việc rất vất vả để khiến cho công nghệ này hoạt động, như là cách mà chúng tôi muốn nói, bằng một cách hoang dại. Và chugns tôi cũng đã rút gọn chúng lại để làm sao các thành phần cảm xúc cốt lõi có thể hoạt động với bất kỳ thiết bị di động nào có camera, giống như chiếc iPad này. Giờ chúng ta cùng thử nghiệm.
As you can see, the algorithm has essentially found Cloe's face, so it's this white bounding box, and it's tracking the main feature points on her face, so her eyebrows, her eyes, her mouth and her nose. The question is, can it recognize her expression? So we're going to test the machine. So first of all, give me your poker face. Yep, awesome. (Laughter) And then as she smiles, this is a genuine smile, it's great. So you can see the green bar go up as she smiles. Now that was a big smile. Can you try a subtle smile to see if the computer can recognize? It does recognize subtle smiles as well. We've worked really hard to make that happen. And then eyebrow raised, indicator of surprise. Brow furrow, which is an indicator of confusion. Frown. Yes, perfect. So these are all the different action units. There's many more of them. This is just a slimmed-down demo. But we call each reading an emotion data point, and then they can fire together to portray different emotions. So on the right side of the demo -- look like you're happy. So that's joy. Joy fires up. And then give me a disgust face. Try to remember what it was like when Zayn left One Direction. (Laughter) Yeah, wrinkle your nose. Awesome. And the valence is actually quite negative, so you must have been a big fan. So valence is how positive or negative an experience is, and engagement is how expressive she is as well. So imagine if Cloe had access to this real-time emotion stream, and she could share it with anybody she wanted to. Thank you. (Applause)
Như các bạn thấy, thuật toán về cơ bản đã tìm ra khuôn mặt của chi Chloe, đó là khung bao màu trắng, và nó theo dõi các điểm đặc tính chính trên khuôn mặt của cô ấy, đó là lông mày, mắt, miệng và mũi của cô ấy. Câu hỏi ở đây là, liệu nó có thể nhận biết được các biểu lộ của cô ấy? Nào giờ chúng ta cùng thử nghiệm cái máy này. Trước tiên, hãy cho chúng tôi thấy một bộ mặt phớt đời. Vâng, tuyệt vời. (Khán giả cười) Và sau đây là cô ấy cười, một nụ cười thực sự, thật tuyệt. Như vậy các bạn đã nhìn thấy các cột màu xanh tăng lên khi mà cô ấy cười. Nào bây giờ là một nụ cười lớn. Bạn có thể thể hiện một nụ cười thật tinh tế để xem máy tính có nhận ra không? Nó cũng đã nhận ra một nụ cười tinh tế. Chúng tôi đã làm việc rất vất vả để tạo ra điều này. Và khi lông mày nhếc lên, đó là chỉ điểm của sự ngạc nhiên. Cái nhíu mày là chỉ điểm của sự bối rối. Cái cau mày. Đúng, tuyệt vời. Có thể thấy đây là toàn bộ những đơn vị hành động khác nhau. Thực tế chúng còn có nhiều hơn nữa. Đây chỉ là một trình diễn đơn giản. Nhưng chúng ta có thể coi mỗi một lần đọc cảm xúc là một điểm dữ liệu, và sau đó chúng có thể tổng hợp lại và đưa ra một chân dung với các cảm xúc khác nhau. Vì thế ở phía bên phải của bản trình diễn-- giống như là bạn đang hạnh phúc. Vì thế sự vui mừng đó. Vui mừng được bùng phát lên. Và sau đó làm cho tôi mọt bộ mặt ghê tởm. Cố gắng nhớ tới điều đó đã như thế nào khi Zayn rời khỏi One Direction. (Khán giả cười) Vâng, nào hãy nhăn mũi. Tuyệt vời. Và trị số tương đối là âm tính, vì thế bạn chắc phải là một người hâm mộ lớn. Vì thế trị số chỉ ra những trải nghiệm tích cực hoặc tiêu cực như thế nào, và sự tham gia cũng là cách biểu lộ của cô ấy. Vì thế tưởng tượng rằng chị Chloe tham gia vào chuỗi cảm xúc thực này, và chị ấy có thể chia sẻ not với bất kỳ ai mà chị ấy muốn. Cảm ơn. (Khán giả vỗ tay)
So, so far, we have amassed 12 billion of these emotion data points. It's the largest emotion database in the world. We've collected it from 2.9 million face videos, people who have agreed to share their emotions with us, and from 75 countries around the world. It's growing every day. It blows my mind away that we can now quantify something as personal as our emotions, and we can do it at this scale.
Cho tới nay, chúng tôi đã tích lỹ được khoảng 12 tỷ dữ liệu cảm xúc như vậy. Đây là một cơ sở dữ liệu cảm xúc lớn nhất thế giới. Chúng tôi đã thu thập nó từ khoảng hơn 2,9 triệu video về khuôn mặt, của những người đã đồng ý chia sẻ những cảm xúc của họ với chúng tôi, và họ đến từ 75 quốc gia trên thế giới. Nó gia tăng từng ngày. Nó đã thổi bay tâm trí của tôi theo đó chúng tôi giờ đây có thể lượng hoá một số cảm xúc cá nhân của chúng ta, và chúng tôi có thể thực hiện nó ở mức độ như thế này.
So what have we learned to date? Gender. Our data confirms something that you might suspect. Women are more expressive than men. Not only do they smile more, their smiles last longer, and we can now really quantify what it is that men and women respond to differently. Let's do culture: So in the United States, women are 40 percent more expressive than men, but curiously, we don't see any difference in the U.K. between men and women. (Laughter) Age: People who are 50 years and older are 25 percent more emotive than younger people. Women in their 20s smile a lot more than men the same age, perhaps a necessity for dating. But perhaps what surprised us the most about this data is that we happen to be expressive all the time, even when we are sitting in front of our devices alone, and it's not just when we're watching cat videos on Facebook. We are expressive when we're emailing, texting, shopping online, or even doing our taxes.
Vậy thì chúng tôi đã học được gì cho tới nay? Giới tính. Dữ liệu của chúng tôi đã xác định được một số điều mà các bạn có thể hoài nghi. Phụ nữ thường biểu cảm nhiều hơn nam giới. Không chỉ là họ cười nhiều hơn, mà nụ cười của họ còn kéo dài hơn, và chúng tôi giờ đây có thể thực sự lượng hoá được điều gì khiến nam giới và phụ nữ đáp ứng khác nhau. Nào cùng xem xét khía cạnh văn hoá: Ở Mỹ phụ nữ có biểu cảm nhiều hơn nam giới tới 40%, nhưng đáng ngạc nhiên, chúng tôi không thấy sự khác biệt giữa nam giới và phụ nữ ở Anh. (Khán giả cười) Độ tuổi: Người trên 50 tuổi biểu lộ cảm xúc nhiều hơn người trẻ 25%. Phụ nữ ở độ tuổi 20 cười nhiều hơn rất nhiều so với nam giới ở cùng độ tuổi, có thể đó là điều cần thiết cho việc hẹn hò. Nhưng có thế điều mà gây cho chúng tôi nhiều ngạc nhiên nhất về số liệu này đó là chúng ta luôn luôn biểu lộ cảm xúc, thậm chí ngay cả khi chúng ta ngồi một mình trước các thiết bị điện tử, và không chỉ là khi chúng ta đang xem một video về mèo trên Facebook. Chúng ta bộc lộ cảm xúc khi chúng ta gửi thư điện tử, chúng ta nhắn tin, chúng ta mua bán trực tuyến, và thậm chí khi chúng ta khai báo thuế.
Where is this data used today? In understanding how we engage with media, so understanding virality and voting behavior; and also empowering or emotion-enabling technology, and I want to share some examples that are especially close to my heart. Emotion-enabled wearable glasses can help individuals who are visually impaired read the faces of others, and it can help individuals on the autism spectrum interpret emotion, something that they really struggle with. In education, imagine if your learning apps sense that you're confused and slow down, or that you're bored, so it's sped up, just like a great teacher would in a classroom. What if your wristwatch tracked your mood, or your car sensed that you're tired, or perhaps your fridge knows that you're stressed, so it auto-locks to prevent you from binge eating. (Laughter) I would like that, yeah. What if, when I was in Cambridge, I had access to my real-time emotion stream, and I could share that with my family back home in a very natural way, just like I would've if we were all in the same room together?
Vậy thì số liệu này được dùng ở đâu hiện nay? để hiểu biết việc chúng ta liên hệ thế nào với truyền thông, hiểu về mức độ là truyền và thái độ bỏ phiếu, và cũng là làm mạnh mẽ và khả thi hơn công nghệ về cảm xúc, và tôi muốn chia sẻ một vài ví dụ mà chúng đặc biệt nằm trong trái tim tôi. Một chiếc kính cảm xúc có thể giúp người mù đọc được cảm xúc trên mặt người khác, và nó có thể giúp những người tự kỷ thể hiện cảm xúc của họ, những điều mà họ thực sự phải đối mặt. Đối với giáo dục, tưởng tượng rằng ứng dụng học tập của bạn có thể cảm nhận được là bạn đang bối rối và đang đuối sức, hoặc khi bạn cảm thấy nhàm chán, thì nó sẽ tăng tốc lên, giống như là một giáo viên tuyệt với ở lớp vậy. Đó là khi đồng hồ đeo tay của bạn sẽ theo dõi cảm xúc của bạn, hoặc ô tô của bản cảm nhận được bạn đang mệt mỏi, hoặc có thể tủ lạnh của bạn biết rằng bạn đang căng thẳng vì thế nó sẽ tự động khoá lại giúp bạn tránh được ăn uống vô độ. (Khán giả cười) Tất nhiên tôi thích điều đó. Đó là, khi tôi ở Cambridge, Tôi đã tạo ra một dòng cảm xúc theo thời gian thực, và có thể chia sẻ nó với gia đình tại quê nhà theo một cách tự nhiên nhất, nó giống như tất cả chúng tôi đang ở trong một căn phòng với nhau vậy phải không?
I think five years down the line, all our devices are going to have an emotion chip, and we won't remember what it was like when we couldn't just frown at our device and our device would say, "Hmm, you didn't like that, did you?" Our biggest challenge is that there are so many applications of this technology, my team and I realize that we can't build them all ourselves, so we've made this technology available so that other developers can get building and get creative. We recognize that there are potential risks and potential for abuse, but personally, having spent many years doing this, I believe that the benefits to humanity from having emotionally intelligent technology far outweigh the potential for misuse. And I invite you all to be part of the conversation. The more people who know about this technology, the more we can all have a voice in how it's being used. So as more and more of our lives become digital, we are fighting a losing battle trying to curb our usage of devices in order to reclaim our emotions. So what I'm trying to do instead is to bring emotions into our technology and make our technologies more responsive. So I want those devices that have separated us to bring us back together. And by humanizing technology, we have this golden opportunity to reimagine how we connect with machines, and therefore, how we, as human beings, connect with one another.
Tôi nghĩ rằng trong vòng 5 năm nữa, toàn bộ các thiết bị điện tử sẽ có các con chíp cảm xúc, và chúng ta không nhớ điều đó đã thế nào khi chúng ta không nhíu mày trước thiết bị điện tử và cái thiết bị điện tử của chúng ta sẽ nói: "Hừm, bạn đã không thích điều đó, phải không?" Trở ngại lớn nhất của chúng tôi hiện nay là có quá nhiều các ứng dụng của công nghệ này, tôi và nhóm của tôi nhận ra rằng chúng tôi không thể tự phát triển toàn bộ chúng, do đó chúng tôi đã làm cho công nghệ này sẵn sàng để các nhà phát triển khác có thể tiếp tục xây dựng và sáng tạo. Chúng tôi nhìn nhận rằng có những rủi ro tiềm ẩn và những sự lạm dụng tiềm ẩn, nhưng về cá nhân tôi, khi đã dành rất nhiều năm cho nó, tôi tin tưởng rằng các lợi ích mang lại cho con người từ công nghệ cảm xúc thông minh vượt xa ngoài những rủi ro tiềm ẩn. Và tôi xin mời toàn bộ các bạn tham gia vào cuộc thảo luận này. Càng nhiều người biết về công nghệ này, chúng ta sẽ càng có tiếng nói đối với việc làm sao để sử dụng đúng công nghệ này. Vì thế khi mà càng ngày cuộc sống của chúng ta càng trở nên số hoá, chúng ta đang thua cuộc trong trận chiến chống lại việc sử dụng các thiết bị điện tử của chúng ta nhằm dành lại cảm xúc của chúng ta. Vì thế thay vào đó, điều mà tôi đang cố gắng làm đó là đưa cảm xúc vào trong công nghệ của chúng ta và làm cho công nghệ của chúng ta trở nên tương tác nhiều hơn. Vì thế tôi muốn rằng những thiết bị điện tử đang làm chia rẽ chúng ta sẽ mang chúng ta trở lại với nhau. Và bởi những công nghệ phục vụ con người, chúng ta có một cơ hội vàng để hình dung lại cách mà chúng ta kết nối với máy móc, và do đó, là những con người, làm thế nào chúng ta kết nối với những người khác.
Thank you.
Cảm ơn.
(Applause)
(Khán giả vỗ tay)