Our emotions influence every aspect of our lives, from our health and how we learn, to how we do business and make decisions, big ones and small. Our emotions also influence how we connect with one another. We've evolved to live in a world like this, but instead, we're living more and more of our lives like this -- this is the text message from my daughter last night -- in a world that's devoid of emotion. So I'm on a mission to change that. I want to bring emotions back into our digital experiences.
احساسات ما روی همهی جنبههای زندگیمان تأثیر میگذارد، از سلامتی و چگونگی یادگیریمان گرفته، تا شیوهی کسب و کار و تصمیمگیریمان، از ریز تا درشت. احساساتمان روی برقراری ارتباطمات با دیگران نیز تأثیر میگذارد. ما چنان رشد کردهایم تا در جهانی اینچنین زندگی کنیم، ولی در مقابل، بیشتر اینگونه زندگی میکنیم -- این پیامک را دخترم، شب گذشته برایم فرستاده است -- در جهانی که خالی از احساسات است. من مأموریت دارم که وضعیت را تغییر دهم. میخواهم احساسات را به تجربهی دیجیتال بیاورم.
I started on this path 15 years ago. I was a computer scientist in Egypt, and I had just gotten accepted to a Ph.D. program at Cambridge University. So I did something quite unusual for a young newlywed Muslim Egyptian wife: With the support of my husband, who had to stay in Egypt, I packed my bags and I moved to England. At Cambridge, thousands of miles away from home, I realized I was spending more hours with my laptop than I did with any other human. Yet despite this intimacy, my laptop had absolutely no idea how I was feeling. It had no idea if I was happy, having a bad day, or stressed, confused, and so that got frustrating. Even worse, as I communicated online with my family back home, I felt that all my emotions disappeared in cyberspace. I was homesick, I was lonely, and on some days I was actually crying, but all I had to communicate these emotions was this. (Laughter) Today's technology has lots of I.Q., but no E.Q.; lots of cognitive intelligence, but no emotional intelligence. So that got me thinking, what if our technology could sense our emotions? What if our devices could sense how we felt and reacted accordingly, just the way an emotionally intelligent friend would? Those questions led me and my team to create technologies that can read and respond to our emotions, and our starting point was the human face.
این راه را ۱۵ سال پیش آغاز کردم. من یک دانشمند کامپیوتر در مصر بودم، و بهتازگی در یک برنامهی دکترا در دانشگاه کمبریج پذیرفته شده بودم. من کاری به نسبت غیر معمول برای یک زن مسلمان مصری تازه عروس انجام دادم: با حمایت همسرم که باید در مصر میماند چمدانهایم را برداشتم و به انگلیس رفتم. در کمبریج، هزاران مایل دور از خانه، فهمیدم که بیشتر ساعات را با لپتاپم سپری میکنم تا با دیگر انسانها. با وجود این صمیمیت، لپتاپ من هیچ ایدهای دربارهی آنچه من احساس میکردم نداشت. هیچ ایدهای دربارهی این که من خوشحالم روز بدی را گذراندهام، استرس داشتهام، یا گیجم، و خب، اینها ناامیدکننده شد. حتی بدتر، هنگامی که با خانوادهام، به صورت آنلاین ارتباط برقرار میکردم، احساس میکردم که تمام احساسات من در فضای سایبری ناپدید میشوند. من دلتنگ خانه بودم، تنها بودم، و بعضی روزها واقعا گریه میکردم، ولی تنها راه ابراز احساساتم این شکلک بود. (خندهی حضار) تکنولوژیِ امروز، بهرهی هوشی بالایی دارد ولی بهرهی احساسی ندارد؛ هوشِ شناختیِ فراوانی دارد، ولی هوش احساسی ندارد. این مرا به فکر فرو برد، اگر تکنولوژی میتوانست احساسات ما را بفهمد، چه میشد؟ چه میشد اگر وسایل ما میتوانستند احساست ما را بفهمند و با توجه به آنها واکنش نشاندهند، مثل هر یک از دوستان ما که هوش احساسی دارد و واکنش نشان میدهد؟ این سؤالات، من و تیمم را به ساخت تکنولوژیهایی که بتوانند احساساتِ ما را بخوانند و به آن پاسخ بدهند سوق داد، و نقطهی شروع ما چهرهی انسانها بود.
So our human face happens to be one of the most powerful channels that we all use to communicate social and emotional states, everything from enjoyment, surprise, empathy and curiosity. In emotion science, we call each facial muscle movement an action unit. So for example, action unit 12, it's not a Hollywood blockbuster, it is actually a lip corner pull, which is the main component of a smile. Try it everybody. Let's get some smiles going on. Another example is action unit 4. It's the brow furrow. It's when you draw your eyebrows together and you create all these textures and wrinkles. We don't like them, but it's a strong indicator of a negative emotion. So we have about 45 of these action units, and they combine to express hundreds of emotions.
چهرهی انسان، یکی از قویترین کانالهاست که همهی ما از آن استفاده میکنیم، تا حالتهای اجتماعی و احساسی را ابراز کنیم، همهچیز، شوق و شگفتیِمان، همدلی و کنجکاویمان. در دانش احساسات، ما به هر حرکت عضلات صورت یک واحد حرکت میگوییم. در نتیجه، برای مثال، حرکتِ واحدِ ۱۲، یک فیلم پرفروش هالیوودی نیست، بلکه در حقیقت، بالا رفتن گوشهی لب است، که یک جزٔ اصلی لبخند است. همه امتحانش کنید. بیایید چندین لبخند داشتهباشیم. مثال دیگر، حرکتِ واحدِ ۴ است، که حرکتِ چروک انداختن ابرو است. زمانی که شما ابروهایتان را درهم میکشید و همهی این الگوها و چینها را میسازید. ما اخم را دوست نداریم، ولی این حرکت نشانگری قوی برای احساسات منفی است. ما حدود ۴۵ واحد حرکتی داریم، و همهی آنها با هم ترکیب میشوند تا صدها احساس را ابراز و بیان کنند.
Teaching a computer to read these facial emotions is hard, because these action units, they can be fast, they're subtle, and they combine in many different ways. So take, for example, the smile and the smirk. They look somewhat similar, but they mean very different things. (Laughter) So the smile is positive, a smirk is often negative. Sometimes a smirk can make you become famous. But seriously, it's important for a computer to be able to tell the difference between the two expressions.
آموزش خواندن احساسات چهره به یک کامپیوتر سخت است، زیرا این واحدهای حرکتی میتوانند سریع، دقیق، و ماهرانه باشند. و به شکلهای مختلف با هم ترکیب شوند. برای مثال، لبخند و پوزخند زدن را در نظر بگیرید. آنها از جهاتی، شبیه به هم هستند، ولی معانی کاملا متفاوتی دارند. (خندهی حضار) لبخند مثبت است، و پوزخند معمولاً منفی. بعضی اوقات، یک پوزخند میتواند شما را معروف کند. ولی جداً، برای یک کامپیوتر مهم است که بتواند دو حالت متفاوت را از هم تشخیص دهد.
So how do we do that? We give our algorithms tens of thousands of examples of people we know to be smiling, from different ethnicities, ages, genders, and we do the same for smirks. And then, using deep learning, the algorithm looks for all these textures and wrinkles and shape changes on our face, and basically learns that all smiles have common characteristics, all smirks have subtly different characteristics. And the next time it sees a new face, it essentially learns that this face has the same characteristics of a smile, and it says, "Aha, I recognize this. This is a smile expression."
حال، ما این کار را چگونه انجام میدهیم؟ ما به الگوریتمهایمان دهها مثال از صدها مثالی که مردم در آنها میخندند را میدهیم، از فرهنگها، سنین، و جنسیتهای متفاوت، و همین کار را برای پوزخندها انجام میدهیم. و سپس، با کمک یادگیری عمیق، الگوریتمْ به همهی این الگوها و چینوچروکها و تغییرات قالبِ چهرهمان نگاه میکند، و به طور اساسی یاد میگیرد که همهی لبخندها ویژگیهای مشابهی دارند و همهی پوزخندها، ویژگیهای ماهرانه، اما متفاوتی دارند. و دفعهی بعد که یک چهرهی جدید را میبیند، ضرورتاً میفهمد که این چهره، ویژگیهای یک لبخند را دارد، و میگوید: «آها، من این را تشخیص میدهم. این جلوهی یک لبخند است.»
So the best way to demonstrate how this technology works is to try a live demo, so I need a volunteer, preferably somebody with a face. (Laughter) Cloe's going to be our volunteer today.
پس بهترین راه برای نشاندادن چگونگی عملکرد این تکنولوژی اجرای یک نمایش زنده است، پس من یک داوطلب میخواهم، ترجیحاً فردی با یک صورت. (خندهی حضار) کلوی داوطلب امروز ما خواهد بود.
So over the past five years, we've moved from being a research project at MIT to a company, where my team has worked really hard to make this technology work, as we like to say, in the wild. And we've also shrunk it so that the core emotion engine works on any mobile device with a camera, like this iPad. So let's give this a try.
در پنج سالِ گذشته، ما از یک پروژهی تحقیقاتی در MIT، به یک شرکت تبدیل شدیم، جایی که تیم من، به سختی کار کردهاست تا این تکنولوژی کار کند، که چیزی است که میخواهیم در واقعیت بگوییم تا در تئوری. همچنین ما، آن را کوچک کردهایم تا هستهی موتور احساسات روی هر دستگاه موبایلِ مجهز به دوربین، مانند این آیپد، کار کند. پس بیایید امتحانش کنیم.
As you can see, the algorithm has essentially found Cloe's face, so it's this white bounding box, and it's tracking the main feature points on her face, so her eyebrows, her eyes, her mouth and her nose. The question is, can it recognize her expression? So we're going to test the machine. So first of all, give me your poker face. Yep, awesome. (Laughter) And then as she smiles, this is a genuine smile, it's great. So you can see the green bar go up as she smiles. Now that was a big smile. Can you try a subtle smile to see if the computer can recognize? It does recognize subtle smiles as well. We've worked really hard to make that happen. And then eyebrow raised, indicator of surprise. Brow furrow, which is an indicator of confusion. Frown. Yes, perfect. So these are all the different action units. There's many more of them. This is just a slimmed-down demo. But we call each reading an emotion data point, and then they can fire together to portray different emotions. So on the right side of the demo -- look like you're happy. So that's joy. Joy fires up. And then give me a disgust face. Try to remember what it was like when Zayn left One Direction. (Laughter) Yeah, wrinkle your nose. Awesome. And the valence is actually quite negative, so you must have been a big fan. So valence is how positive or negative an experience is, and engagement is how expressive she is as well. So imagine if Cloe had access to this real-time emotion stream, and she could share it with anybody she wanted to. Thank you. (Applause)
همانطور که میتوانید مشاهدهکنید، الگوریتم صورت کلوی را یافته است، پس این جعبهی سفید کادر صورت را نشان میدهد، که دارد خصوصیات اصلی صورتش را دنبال میکند؛ ابروهایش، چشمانش، دهانش، و دماغش. سؤال این است که آیا میتواند احساساتش را نیز شناسایی کند؟ پس ما دستگاه را تست میکنیم. اول از همه، صورت بدون احساست را به من نشان بده. بله، عالی است! (خندهی حضار) حالا او میخندد، این یک خندهی خالص است، عالی است. میتوانید ببینید که نوار سبز با خندیدن او بزرگ میشود. این یک خندهی بزرگ بود. میتوانی کمی ملایم بخندی تا ببینیم کامپیوتر میتواند آن را شناسایی کند؟ بله، میتواند خندهی ماهرانه را هم به همین ترتیب شناسایی کند. ما واقعا سخت کار کردهایم تا این کار را انجام دهیم. و بعد، بالا رفتن ابروها، که نشاندهندهی شگفتی است. چینخوردگی پیشانی، نشاندهندهی گیجی است. رو ترش کُن. بله، عالی است. پس اینها همهی واحدهایِ حرکتیِ متفاوت هستند. چندین حرکت دیگر نیز وجود دارد. این یک نمایش کوچکشده است. ما به هر خواندن، یک نقطهی دادهی احساسات میگوییم. و این نقاط میتوانند با هم ترکیب شوند تا نشاندهندهی احساسات متفاوت باشند. پس در سمتِ راستِ نمونهی نمایشی-- نشان بده که خوشحالی. این شوق است. شوق زیاد میشود. و حالا به من یک صورت منزجر نشان بده. احساست را، زمانی که زِین، گروهِ واندایرِکشن را ترک کرد، به خاطر بیاور. (خندهی حضار) بله، دماغت را چین بده. عالی است. و نشانگر ظرفیت تا حدودی منفی شد، پس حتما یک طرفدار واقعی هستی. معیارِ ظرفیت، مثبت یا منفی بودنِ تجربه را نشان میدهد، و معیارِ درگیری نشاندهندهی تأثیری است که حالت صورت فرد خواهد گذاشت. پس زمانی را تصور کنید که کلوی به این رشتهی احساسات بیدرنگ دسترسی داشت، و میتوانست آن را با هر کسی که میخواهد در میان بگذارد. متشکرم. (تشویق حضار)
So, so far, we have amassed 12 billion of these emotion data points. It's the largest emotion database in the world. We've collected it from 2.9 million face videos, people who have agreed to share their emotions with us, and from 75 countries around the world. It's growing every day. It blows my mind away that we can now quantify something as personal as our emotions, and we can do it at this scale.
تابهحال، ما ۱۲ میلیارد از این نقاطِ احساسی را جمعآوری کردهایم. این مجموعه، بزرگترین پایگاهدادهی احساسات در دنیاست. آن را از ۲/۹ میلیون ویدیوی چهره جمعآوری کردهایم، که شرکتکنندگان با در اختیار گذاشتن احساساتشان موافقت کردهاند، و از ۷۵ کشور در سراسر جهان شرکت کردهاند. این مجموعه، هر روز رو به رشد است. مغزم منفجر میشود، زمانی که فکر میکنم که ما میتوانیم چیزی خصوصی مانند احساسات را تا این حد، اندازه بگیریم.
So what have we learned to date? Gender. Our data confirms something that you might suspect. Women are more expressive than men. Not only do they smile more, their smiles last longer, and we can now really quantify what it is that men and women respond to differently. Let's do culture: So in the United States, women are 40 percent more expressive than men, but curiously, we don't see any difference in the U.K. between men and women. (Laughter) Age: People who are 50 years and older are 25 percent more emotive than younger people. Women in their 20s smile a lot more than men the same age, perhaps a necessity for dating. But perhaps what surprised us the most about this data is that we happen to be expressive all the time, even when we are sitting in front of our devices alone, and it's not just when we're watching cat videos on Facebook. We are expressive when we're emailing, texting, shopping online, or even doing our taxes.
تا به حال چه آموختهایم؟ جنسیت. دادههای ما، چیزهایی که ممکن است در آنها شک داشته باشید را، تأیید میکنند. خانمها از آقایان واضحتر ابراز احساسات میکنند. نه تنها بیشتر لبخند میزنند، بلکه لبخندهایشان با دوامتر است. و ما میتوانیم ارزیابی کنیم، که زنان و مردان به چه چیزهایی واکنشهای متفاوتی نشان میدهند. بیایید فرهنگ را بررسی کنیم: در ایالات متحده، زنان ۴۰ درصد بیشتر از مردان در بیان احساسات خود گویا هستند، ولی به شکل عجیبی، هیچ تفاوتی بین زنان و مردان در انگلستان، مشاهده نمیشود. (خندهی حضار) سن: کسانی که ۵۰ سال یا بیشتر سن دارند، ۲۵ درصد بیشتر از افراد جوانتر احساساتی هستند. زنان در دههی بیستسالگیشان، بسیار بیشتر از مردان با سن مشابه لبخند میزنند. شاید این یکی از الزامات معاشرت است. اما شاید آنچه از بیشتر دربارهی این دادهها شگفتزدهمان کرد این بود که ما در تمام مدت در حال ابرازِ احساساتیم، حتی زمانی که به تنهایی در مقابل دستگاهمان نشستهایم، و نه تنها زمانی که داریم ویدیوی یک گربه را در فیسبوک میبینیم، بلکه همیشه. ما هنگام ایمیل زدن،پیامک زدن، خرید آنلاین، یا حتی پرداخت مالیات، در حال ابراز احساساتیم.
Where is this data used today? In understanding how we engage with media, so understanding virality and voting behavior; and also empowering or emotion-enabling technology, and I want to share some examples that are especially close to my heart. Emotion-enabled wearable glasses can help individuals who are visually impaired read the faces of others, and it can help individuals on the autism spectrum interpret emotion, something that they really struggle with. In education, imagine if your learning apps sense that you're confused and slow down, or that you're bored, so it's sped up, just like a great teacher would in a classroom. What if your wristwatch tracked your mood, or your car sensed that you're tired, or perhaps your fridge knows that you're stressed, so it auto-locks to prevent you from binge eating. (Laughter) I would like that, yeah. What if, when I was in Cambridge, I had access to my real-time emotion stream, and I could share that with my family back home in a very natural way, just like I would've if we were all in the same room together?
امروزه، این دادهها در کجا استفاده میشود؟ در فهم این که ما چگونه با رسانهها در ارتباطیم، در فهم الگوهای اشتراکگذاریِ ویدیوها و رأی دادن؛ و همچنین قدرت دادن یا احساسی کردن تکنولوژی، میخواهم چند مثال با شما در میان بگذارم که قلبم را درهم میفشارند. عینکهای هوشمند از نظر احساسات میتوانند به افرادی که از نظر بینایی مشکل دارند، در فهمِ احساساتِ دیگران، یاری برسانند، و به افراد مبتلا به اوتیسم نیز در قالبِ مترجم احساسات کمک کنند، مشکلی که واقعاً این افراد دارند با آن دست و پنجه نرم میکنند. در آموزش: اگر شما در حال یادگیری هستید، اپلیکیشنها سردرگمی شما را احساس میکنند و سرعتشان کم میشود. یا اگر حوصلهتان سر رفته سرعتشان بالا میرود، مانند یک معلم عالی در کلاس درس. چه میشد اگر ساعت مچی شما احساساتتان را درک میکرد، یا ماشینتان میفهمید که شما خسته هستید، یا یخچالتان میفهمید که شما مضطرب هستید، و بهطور خودکار بسته میشد تا از پرخوری شما جلوگیری کند. (خندهی حضار) من این را دوست دارم، بله. چه میشد اگر زمانی که من در کمبریج بودم، به رشتهی احساسات بیدرنگم دسترسی داشتم، و میتوانستم آن را با خانوادهام در خانه به صورت طبیعی در میان بگذارم، همانطور که انگار با آنها در یک اتاق هستم؟
I think five years down the line, all our devices are going to have an emotion chip, and we won't remember what it was like when we couldn't just frown at our device and our device would say, "Hmm, you didn't like that, did you?" Our biggest challenge is that there are so many applications of this technology, my team and I realize that we can't build them all ourselves, so we've made this technology available so that other developers can get building and get creative. We recognize that there are potential risks and potential for abuse, but personally, having spent many years doing this, I believe that the benefits to humanity from having emotionally intelligent technology far outweigh the potential for misuse. And I invite you all to be part of the conversation. The more people who know about this technology, the more we can all have a voice in how it's being used. So as more and more of our lives become digital, we are fighting a losing battle trying to curb our usage of devices in order to reclaim our emotions. So what I'm trying to do instead is to bring emotions into our technology and make our technologies more responsive. So I want those devices that have separated us to bring us back together. And by humanizing technology, we have this golden opportunity to reimagine how we connect with machines, and therefore, how we, as human beings, connect with one another.
فکر میکنم که ۵ سال دیگر از الان، همهی وسایل ما یک تراشهی احساسات خواهند داشت، و ما دیگر زمانی را بهیاد نمیآوریم که نمیتوانستیم به وسیلهمان اخم کنیم، و وسیلهمان به ما میگوید: «هممم، این را دوست نداشتی، نه؟» بزرگترین چالش ما کاربردهای زیاد این تکنولوژی است. من و تیمم به این نتیجه رسیدیم که نمیتوانیم همهی اپلیکیشنها را خودمان بسازیم، پس این تکنولوژی را در دسترس قرار دادیم تا سایر توسعهدهندگان بتوانند این برنامهها را بسازند و خلاق باشند. ما متوجه شدیم که امکان خطر و همچنین سؤاستفاده وجود دارد، ولی بهشخصه، بعد از چندین سال انجام این کار، باور دارم که این تکنولوژی مزایایی برای انسانیت دارد و داشتن تکنولوژی هوشمند احساسی ارزشمندتر امکان سؤاستفاده است. من شما را دعوت میکنم که بخشی از این گفتوگو شوید. این که افراد بیشتری دربارهی این تکنولوژی بدانند، کمک میکند تا بیشتر بتوانیم بگوییم که چگونه از آن استفاده میشود. همانطور که زندگیمان بیشتر و بیشتر دیجیتالی میشود، در یک جنگ شکست خورده مبارزه میکنیم تا از استفاده از وسایل در زندگیمان کم کنیم به این منظور که احساساتمان را بازگردانیم. چیزی که من در عوض برایش تلاش میکنم این است که احساسات را به درون تکنولوژی بیاورم و کاری کنم که تکنولوژیهایمان پاسخگوتر باشد. پس میخواهم وسایلی که ما را از هم جدا کردهاند، دوباره ما را به هم بازگردانند. با انسانی کردن تکنولوژی، این فرصت طلایی را داریم که دوباره دربارهی ارتباطمان با ماشینها فکر کنیم، و در نهایت، این که چگونه ما، به عنوان انسانها، با یکدیگر ارتباط برقرار میکنیم.
Thank you.
متشکرم.
(Applause)
(تشویق حضار)