Imagine if you could record your life -- everything you said, everything you did, available in a perfect memory store at your fingertips, so you could go back and find memorable moments and relive them, or sift through traces of time and discover patterns in your own life that previously had gone undiscovered. Well that's exactly the journey that my family began five and a half years ago. This is my wife and collaborator, Rupal. And on this day, at this moment, we walked into the house with our first child, our beautiful baby boy. And we walked into a house with a very special home video recording system.
ลองจินตนาการดูนะครับ ถ้าคุณถ่ายวิดีโอชีวิตตัวเอง ทุกอย่างที่คุณพูด ทุกอย่างที่คุณทำ ถูกเก็บไว้อย่างสมบูรณ์ ให้คุณเปิดดูได้เพียงปลายนิ้วสัมผัส คุณสามารถย้อนกลับไป ค้นหาช่วงเวลาที่น่าจดจำและสัมผัสมันได้ใหม่ หรือมองผ่านช่วงเวลา เพื่อค้นหาแบบแผนในชีวิตของคุณ ที่คุณไม่เคยสังเกตเห็นมาก่อน นั่นแหละครับ คือการผจญภัย ที่ครอบครัวผมเริ่มต้น เมื่อห้าปีครึ่งที่แล้ว นี่ภรรยาผม และทีมงานของผม รูพัล วันนั้น วินาทีนั้น เราเดินเข้าไปในบ้านพร้อมกับลูกคนแรกของเรา ลูกชายที่น่ารักของเรา เราเดินเข้าไปในบ้าน ที่มีระบบบันทึกวิดีโอที่พิเศษสุด
(Video) Man: Okay.
(วิดีโอ) ชายในวิดีโอ: โอเค
Deb Roy: This moment and thousands of other moments special for us were captured in our home because in every room in the house, if you looked up, you'd see a camera and a microphone, and if you looked down, you'd get this bird's-eye view of the room. Here's our living room, the baby bedroom, kitchen, dining room and the rest of the house. And all of these fed into a disc array that was designed for a continuous capture. So here we are flying through a day in our home as we move from sunlit morning through incandescent evening and, finally, lights out for the day. Over the course of three years, we recorded eight to 10 hours a day, amassing roughly a quarter-million hours of multi-track audio and video.
เด็บ รอย: ช่วงเวลานี้ และช่วงเวลาอีกนับพันที่พิเศษสำหรับเรา ได้ถูกบันทึกในบ้านของเรา เพราะทุกๆ ห้องในบ้านของเรา ถ้าคุณมองขึ้นไป คุณจะเห็นกล้องกับไมโครโฟน ถ้าคุณมองลงมาจากกล้องนั้น คุณจะเห็นห้องทั้งห้องจากมุมสูง นี่คือห้องรับแขกของเรา ห้องของลูก ครัว ห้องทานข้าว และส่วนอื่นๆ ของบ้าน ทั้งหมดนี้ถูกบันทึกลงในดิสก์ความจุมหาศาล ที่ถูกออกแบบมาให้บันทึกข้อมูลได้อย่างต่อเนื่อง นี่เรากำลังเดินทางผ่านเวลาวันหนึ่งในบ้านของเรา จากตอนเช้าที่พระอาทิตย์ส่อง จนค่ำที่แสงไฟเข้ามาแทนที่ จนกระทั่งแสงไฟดับไป ตลอดเวลาสามปี เราบันทึกวิดีโอแบบนี้วันละ 8-10 ชั่วโมง รวมๆ แล้วก็ประมาณ 150,000 ชั่วโมง มีทั้งเสียงและวิดีโอ
So you're looking at a piece of what is by far the largest home video collection ever made. (Laughter) And what this data represents for our family at a personal level, the impact has already been immense, and we're still learning its value. Countless moments of unsolicited natural moments, not posed moments, are captured there, and we're starting to learn how to discover them and find them.
ที่คุณกำลังดูอยู่นี่ก็เลยเป็น โฮมวิดีโอที่ยาวที่สุดที่เคยมีคนทำมา (เสียงหัวเราะ) สิ่งที่ข้อมูลชิ้นนี้ถ่ายทอด สำหรับครอบครัวของเรา มีความหมายมหาศาล และเราก็กำลังเรียนรู้คุณค่าของมัน ช่วงเวลานับไม่ถ้วน ช่วงเวลาที่เป็นธรรมชาติ ไม่เสแสร้ง ได้ถูกบันทึกเอาไว้ และเราก็เริ่มเรียนรู้ที่จะค้นหา และค้นพบมัน
But there's also a scientific reason that drove this project, which was to use this natural longitudinal data to understand the process of how a child learns language -- that child being my son. And so with many privacy provisions put in place to protect everyone who was recorded in the data, we made elements of the data available to my trusted research team at MIT so we could start teasing apart patterns in this massive data set, trying to understand the influence of social environments on language acquisition. So we're looking here at one of the first things we started to do. This is my wife and I cooking breakfast in the kitchen, and as we move through space and through time, a very everyday pattern of life in the kitchen.
แต่โครงการนี้มีเหตุผลทางวิทยาศาสตร์อยู่เบื้องหลังด้วยครับ นั่นคือ เราจะใช้ข้อมูลที่เกิดขึ้นตามธรรมชาติในระยะยาว เพื่อทำความเข้าใจกระบวนการ ที่เด็กเรียนรู้ภาษา เด็กคนนั้นคือลูกชายของผมเอง และเนื่องจากมีข้อมูลส่วนตัวมากมายถูกบันทึกไว้ในนี้ เพื่อปกป้องทุกคนที่ถูกบันทึกไว้ในข้อมูลชุดนี้ เราจึงเปิดเผยข้อมูลเพียงบางส่วน กับทีมวิจัยที่ผมไว้ใจที่ MIT เท่านั้น แล้วเราก็เริ่มวิเคราะห์แยกแยะแบบแผน ที่อยู่ในข้อมูลมากมายมหาศาลนี้ เพื่อทำความเข้าใจอิทธิพลของสิ่งแวดล้อมทางสังคม ที่มีต่อการเรียนรู้ภาษา ที่เราเห็นอยู่นี่ คืออย่างแรกที่เราเริ่มทำ นี่คือผมกับภรรยากำลังทำอาหารเช้าอยู่ในครัว และเราก็เคลื่อนที่ผ่านพี้นที่และเวลา เป็นแบบแผนที่เกิดขึ้นในครัวทุกวัน
In order to convert this opaque, 90,000 hours of video into something that we could start to see, we use motion analysis to pull out, as we move through space and through time, what we call space-time worms. And this has become part of our toolkit for being able to look and see where the activities are in the data, and with it, trace the pattern of, in particular, where my son moved throughout the home, so that we could focus our transcription efforts, all of the speech environment around my son -- all of the words that he heard from myself, my wife, our nanny, and over time, the words he began to produce. So with that technology and that data and the ability to, with machine assistance, transcribe speech, we've now transcribed well over seven million words of our home transcripts. And with that, let me take you now for a first tour into the data.
เพื่อที่จะแปลง วิดีโอ 90,000 ชั่วโมงที่ยากจะเข้าใจ ให้กลายเป็นอะไรที่เราสามารถเข้าใจได้ เราใช้การวิเคราะห์การเคลื่อนไหว (motion analysis) เพื่อสกัดการเคลื่อนที่ของเราผ่านพี้นที่และผ่านเวลา ซึ่งเราเรียกว่าตัวหนอนในพี้นที่และเวลา และนี่ก็ได้กลายเป็นส่วนหนึ่งของเครื่องมือ ที่ช่วยให้เรามองเห็น ว่ามีกิจกรรมอะไรเกิดขึ้นในวิดีโอ และใช้มันเพื่อสืบย้อนไปดูแบบแผน ว่าลูกชายของผมเคลื่อนที่ไปไหนในบ้านบ้าง เราจะได้มุ่งถอดเทป คำพูดทั้งหมดในสิ่งแวดล้อมรอบตัวลูกชายผม ทุกคำที่เขาได้ยินจากผม จากภรรยาผม จากพี่เลี้ยง และคำที่เขาเริ่มพูดเมื่อเวลาผ่านไป ด้วยเทคโนโลยีดังกล่าวกับข้อมูลที่เรามี และความสามารถของเครื่องมือ ที่ใช้ช่วยถอดเทปคำพูด ตอนนี้เราถอดเทปไปได้ มากกว่าเจ็ดล้านคำแล้ว และตอนนี้ ผมขอพาคุณ ไปชมผลจากข้อมูลของเราเป็นครั้งแรก
So you've all, I'm sure, seen time-lapse videos where a flower will blossom as you accelerate time. I'd like you to now experience the blossoming of a speech form. My son, soon after his first birthday, would say "gaga" to mean water. And over the course of the next half-year, he slowly learned to approximate the proper adult form, "water." So we're going to cruise through half a year in about 40 seconds. No video here, so you can focus on the sound, the acoustics, of a new kind of trajectory: gaga to water.
ผมมั่นใจว่าทุกคนคงเคยเห็น วิดีโอเร่งความเร็ว ที่คุณจะเห็นดอกไม้บานเมื่อคุณเร่งความเร็วของวิดีโอ ทีนี้ ผมอยากให้คุณได้สัมผัส การเบ่งบานของคำพูดบ้าง ลูกชายของผม ตอนอายุหนึ่งขวบ คำว่า "กากา" (gaga) ของเขาหมายถึง "น้ำ" (water) ภายในเวลาครึ่งปีต่อมา เขาค่อยๆ เรียนรู้ที่จะพูด คำว่า "น้ำ" (water) ให้เหมือนผู้ใหญ่พูด เราจะเดินทางผ่านเวลาครึ่งปี ภายในเวลา 40 วินาที ไม่มีภาพวิดีโอนะครับ คุณจะได้มุ่งความสนใจไปที่เสียง ที่เกิดขึ้นภายในช่วงเวลาเหล่านี้ กากาเปลี่ยนเป็นวอเตอร์
(Audio) Baby: Gagagagagaga Gaga gaga gaga guga guga guga wada gaga gaga guga gaga wader guga guga water water water water water water water water water.
(เสียง) เด็ก: กา กา กา กา กา กา กากา กากา กากา กูกา กูกา กูกา วาดา กากา กากา กูกา กากา วาเดอ กูกา กูกา วอเดอ วอเดอ วอเดอ วอเดอ วอเดอ วอเดอ วอเดอ วอเดอ วอเตอร์
DR: He sure nailed it, didn't he.
เด็บ รอย: เขาพูดชัดๆ เน้นๆ เลย ใช่ไหมครับ
(Applause)
(เสียงปรบมือ)
So he didn't just learn water. Over the course of the 24 months, the first two years that we really focused on, this is a map of every word he learned in chronological order. And because we have full transcripts, we've identified each of the 503 words that he learned to produce by his second birthday. He was an early talker. And so we started to analyze why. Why were certain words born before others? This is one of the first results that came out of our study a little over a year ago that really surprised us. The way to interpret this apparently simple graph is, on the vertical is an indication of how complex caregiver utterances are based on the length of utterances. And the [horizontal] axis is time.
เขาไม่ได้เรียนรู้เฉพาะคำว่าน้ำ (water) ตลอดเวลา 24 เดือน หรือสองปีแรก ซึ่งเราสนใจมากที่สุดในงานวิจัยนี้ นี่คือแผนที่ของคำทุกคำที่เขาเรียนรู้เรียงตามลำดับก่อนหลัง และเนื่องจากเรามีบทที่ถอดเทปมาทั้งหมด เราระบุคำ 503 คำที่เขาเรียนรู้ และพูดได้ภายในเวลาสองขวบปีแรก เขาเป็นเด็กที่เริ่มพูดเร็ว เราก็เลยสนใจวิเคราะห์ว่าทำไม ทำไมคำบางคำถึงเกิดก่อนคำอื่น? นี่เป็นหนึ่งในผลการวิเคราะห์ชุดแรก ที่ออกมาเมื่อสักปีกว่าที่ผ่านมา และทำให้เราแปลกใจจริงๆ วิธีตีความกราฟง่ายๆ นี้ก็คือ แกนตั้งนี่คือดัชนีแสดง ความซับซ้อนของคำพูดของผู้เลี้ยงดู วัดจากความยาวของประโยคที่พูด ส่วนแกนนอนคือเวลา
And all of the data, we aligned based on the following idea: Every time my son would learn a word, we would trace back and look at all of the language he heard that contained that word. And we would plot the relative length of the utterances. And what we found was this curious phenomena, that caregiver speech would systematically dip to a minimum, making language as simple as possible, and then slowly ascend back up in complexity. And the amazing thing was that bounce, that dip, lined up almost precisely with when each word was born -- word after word, systematically. So it appears that all three primary caregivers -- myself, my wife and our nanny -- were systematically and, I would think, subconsciously restructuring our language to meet him at the birth of a word and bring him gently into more complex language. And the implications of this -- there are many, but one I just want to point out, is that there must be amazing feedback loops. Of course, my son is learning from his linguistic environment, but the environment is learning from him. That environment, people, are in these tight feedback loops and creating a kind of scaffolding that has not been noticed until now.
วิธีวิเคราะห์ข้อมูลของเรา เป็นอย่างนี้ครับ ทุกครั้งที่ลูกชายของผมพูดคำใหม่ได้ เราจะสืบย้อนไปดูทุกสิ่งทุกอย่างที่เขาได้ยิน ที่มีคำนั้นอยู่ด้วย แล้วเราก็จะพลอตความยาวของคำพูดที่มีคำนั้นอยู่ สิ่งที่เราพบคือปรากฏการณ์ที่น่าสนใจอย่างนี้ครับ คำพูดของผู้เลี้ยงดูจะลดความซับซ้อนลงอย่างเป็นระบบ ใช้ภาษาให้ง่ายที่สุดเท่าที่จะเป็นไปได้ แล้วค่อยๆ เพิ่มความซับซ้อนกลับขึ้นมาช้าๆ ที่น่าทึ่งก็คือ จุดเปลี่ยนที่เส้นกราฟเด้งกลับ ตรงพอดีเป๊ะ กับเวลาเกิดของคำแต่ละคำ คำแล้วคำเล่า อย่างเป็นระบบ ดูเหมือนว่าผู้เลี้ยงดูหลักทั้งสามคน คือผม ภรรยา และพี่เลี้ยง อย่างเป็นระบบ และโดยไม่รู้ตัว ได้จัดโครงสร้างภาษาที่เราใช้ เพื่อให้เหมาะกับเขาจนเขาเริ่มพูดคำแต่ละคำได้ แล้วค่อยๆ นำเขาให้เรียนรู้ภาษาที่ซับซ้อนขึ้นอย่างช้าๆ ข้อค้นพบนี้สะท้อนอะไรที่สำคัญหลายอย่าง แต่อย่างหนึ่งที่ผมอยากชี้ให้เห็นก็คือ มันต้องมีวงจรของผลป้อนกลับ (feedback) ที่น่าทึ่ง แน่ละ ลูกชายผมเรียนรู้ จากสิ่งแวดล้อมทางภาษาของเขา แต่สิ่งแวดล้อมก็เรียนรู้จากเขาด้วยเหมือนกัน สิ่งแวดล้อมที่ว่านั่นคือผู้คน ซึ่งอยู่ในวงจรของผลป้อนกลับนี้ และสร้างสิ่งที่เปรียบเหมือนนั่งร้านทางภาษา ซึ่งเราไม่เคยสังเกตเห็นมาก่อน
But that's looking at the speech context. What about the visual context? We're not looking at -- think of this as a dollhouse cutaway of our house. We've taken those circular fish-eye lens cameras, and we've done some optical correction, and then we can bring it into three-dimensional life. So welcome to my home. This is a moment, one moment captured across multiple cameras. The reason we did this is to create the ultimate memory machine, where you can go back and interactively fly around and then breathe video-life into this system. What I'm going to do is give you an accelerated view of 30 minutes, again, of just life in the living room. That's me and my son on the floor. And there's video analytics that are tracking our movements. My son is leaving red ink. I am leaving green ink. We're now on the couch, looking out through the window at cars passing by. And finally, my son playing in a walking toy by himself.
เอาล่ะครับ นั่นเป็นเรื่องเสียงและการพูด มาดูเรื่องภาพกันบ้าง เราไม่ได้ดูภาพห้องต่างๆ แยกกัน คิดซะว่านี่เป็นเหมือนบ้านตุ๊กตา เราเอาภาพจากกล้องที่ใช้เลนส์มุมกว้าง มาแก้สัดส่วนของภาพ แล้วเอามาต่อกันเป็นภาพสามมิติ ยินดีต้อนรับสู่บ้านของเราครับ นี่เป็นช่วงขณะหนึ่ง ที่ถูกบันทึกด้วยกล้องหลายตัวในเวลาเดียวกัน เราทำแบบนี้เพื่อสร้างเครื่องเก็บความทรงจำ ที่คุณสามารถย้อนกลับไปและเคลื่อนที่ไปมาในนี้ได้ แล้วก็เอาสิ่งที่เกิดขึ้นในวิดีโอใส่เข้าไป สิ่งที่ผมกำลังจะทำคือ ผมจะให้คุณดูภาพเร่งความเร็วของวิดีโอยาว 30 นาที เป็นสิ่งที่เกิดขึ้นในห้องนั่งเล่น นั่นคือผมกับลูกชายของผมนั่งอยู่บนพี้น แล้วก็มีระบบวิเคราะห์วิดีโอ ที่ติดตามการเคลื่อนไหวของเรา การเคลื่อนไหวของลูกชายผมคือเส้นสีแดง ของผมสีเขียว ตอนนี้เราอยู่บนโซฟา มองผ่านหน้าต่างออกไปที่รถที่วิ่งผ่านไปมา แล้วลูกชายของผมก็เล่นกับของเล่นของเขา
Now we freeze the action, 30 minutes, we turn time into the vertical axis, and we open up for a view of these interaction traces we've just left behind. And we see these amazing structures -- these little knots of two colors of thread we call "social hot spots." The spiral thread we call a "solo hot spot." And we think that these affect the way language is learned. What we'd like to do is start understanding the interaction between these patterns and the language that my son is exposed to to see if we can predict how the structure of when words are heard affects when they're learned -- so in other words, the relationship between words and what they're about in the world.
ทีนี้ เราหยุดการเคลื่อนไหว 30 นาทีที่ผ่านมา เอาเวลามาพล็อตเป็นแกนตั้ง แล้วก็มาดูภาพ ร่องรอยการปฏิสัมพันธ์ที่เราทิ้งไว้เมื่อกี้ เราพบโครงสร้างที่น่าทึ่งแบบนี้ครับ ปมเล็กๆ ที่เกิดจากเส้นด้ายสองสีเหล่านี้ เราเรียกว่าจุดศูนย์รวมกิจกรรมทางสังคม (social hot spots) ส่วนเส้นที่วนเป็นเกลียวๆ นี่ เราเรียกว่าจุดศูนย์กลางกิจกรรมเดี่ยว (solo hot spot) เราคิดว่าแบบแผนพวกนี้มีผลต่อการเรียนรู้ภาษา สิ่งที่เราอยากทำต่อไปก็คือ ทำความเข้าใจ ปฏิสัมพันธ์ระหว่างแบบแผนเหล่านี้ กับภาษาที่ลูกชายของผมได้ยินได้เห็น เพื่อดูว่าเราจะสามารถทำนายได้ไหม ว่าการที่เขาได้ยินคำนั้นที่ไหน เมื่อไหร่ มีผลกับเวลาและสถานที่ที่เขาพูดคำนั้นได้หรือเปล่า พูดอีกอย่างคือ ความสัมพันธ์ ระหว่างคำกับสถานที่ที่มันเกิด
So here's how we're approaching this. In this video, again, my son is being traced out. He's leaving red ink behind. And there's our nanny by the door.
วิธีการของเราเป็นอย่างนี้ครับ ในวิดีโอนี้ เราติดตามลูกชายของผม เขาทิ้งร่องรอยเป็นเส้นสีแดงไว้ แล้วนั่นคือพี่เลี้ยง อยู่ตรงข้างประตู
(Video) Nanny: You want water? (Baby: Aaaa.) Nanny: All right. (Baby: Aaaa.)
(วิดีโอ) พี่เลี่ยง: เอาน้ำ (water) ไหมจ๊ะ? (เด็ก: อาาา) พี่เลี้ยง: ได้จ้ะ (เด็ก: อาาา)
DR: She offers water, and off go the two worms over to the kitchen to get water. And what we've done is use the word "water" to tag that moment, that bit of activity. And now we take the power of data and take every time my son ever heard the word water and the context he saw it in, and we use it to penetrate through the video and find every activity trace that co-occurred with an instance of water. And what this data leaves in its wake is a landscape. We call these wordscapes. This is the wordscape for the word water, and you can see most of the action is in the kitchen. That's where those big peaks are over to the left. And just for contrast, we can do this with any word. We can take the word "bye" as in "good bye." And we're now zoomed in over the entrance to the house. And we look, and we find, as you would expect, a contrast in the landscape where the word "bye" occurs much more in a structured way. So we're using these structures to start predicting the order of language acquisition, and that's ongoing work now.
เด็บ รอย: เธอถามเขาว่าอยากได้น้ำไหม แล้วตัวหนอนสองตัวก็เคลื่อนที่ ไปทางห้องครัว เพื่อเอาน้ำ เราใช้คำว่า "น้ำ" (water) เพื่อทำเครื่องหมายช่วงเวลานั้นไว้ แล้วเราก็ใช้พลังของข้อมูลมหาศาล สกัดเอาทุกๆ ครั้งที่ลูกชายของผม ได้ยินคำว่า "น้ำ" (water) และบริบทที่เขาได้ยินมัน เราค้นหาทั่วทุกชั่วโมงในวิดีโอ เพื่อหากิจกรรมทุกอย่าง ที่เกิดขึ้นพร้อมกับคำว่า "น้ำ" (water) สิ่งที่ร่องรอยของข้อมูลทิ้งไว้ให้ คือภูมิทัศน์อันนี้ เราเรียกว่า ภูมิทัศน์ของคำ นี่คือภูมิทัศน์ของคำว่า "น้ำ" (water) คุณจะเห็นว่ากิจกรรมส่วนใหญ่ที่มีคำว่าน้ำเกิดขึ้นในครัว ตรงที่มีข้อมูลเป็นยอดเขาสูงอยู่ตรงซ้ายมือนั่น และเพื่อเปรียบเทียบ เราทำแบบนี้กับคำอะไรก็ได้ เราลองกับคำว่า "บาย" (bye) อย่างคำว่า "กู๊ดบาย" (good bye) เราซูมเข้าไปที่ประตูเข้าบ้าน แล้วก็อย่างที่คุณน่าจะคาดได้ เราพบภูมิทัศน์ของที่ที่ คำว่า "บาย" เกิดขึ้นบ่อยๆ ซึ่งแตกต่างออกไป เรากำลังใช้โครงสร้างพวกนี้ เพื่อทำนาย ลำดับขั้นตอนของการเรียนรู้ภาษา งานนี้กำลังอยู่ระหว่างดำเนินการครับ
In my lab, which we're peering into now, at MIT -- this is at the media lab. This has become my favorite way of videographing just about any space. Three of the key people in this project, Philip DeCamp, Rony Kubat and Brandon Roy are pictured here. Philip has been a close collaborator on all the visualizations you're seeing. And Michael Fleischman was another Ph.D. student in my lab who worked with me on this home video analysis, and he made the following observation: that "just the way that we're analyzing how language connects to events which provide common ground for language, that same idea we can take out of your home, Deb, and we can apply it to the world of public media." And so our effort took an unexpected turn.
มาดูงานในแล็บของผมที่ MIT บ้าง นี่คือห้องปฏิบัติการด้านสื่อ เดี๋ยวนี้ผมเลยชอบ ถ่ายวิดีโอแบบนี้ไปหมดทุกที่เลย ในรูปนี่คือทีมงานหลักสามคนในโครงการนี้ ฟิลลิป เดอแคมป์ โรนี่ คูบัต และแบรนดอน รอย ฟิลลิปเป็นคนจัดเตรียม ภาพทั้งหมดที่คุณเห็นอยู่นี้ และไมเคิล ไฟล์ชแมน เป็นนักศึกษาปริญญาเอกอีกคนหนึ่งในแล็บของผม ที่ทำงานวิเคราะห์โฮมวิดีนี้กับผม เขาตั้งข้อสังเกตว่า "วิธีที่เราใช้วิเคราะห์ว่า ภาษาสัมพันธ์กับเหตุการณ์อย่างไร ซึ่งทำให้เราเข้าใจพื้นที่ส่วนกลางที่เป็นที่เกิดของภาษา แนวคิดนี้เราสามารถเอาไปใช้ที่อื่นนอกบ้านได้นะเด็บ เราเอาไปประยุกต์กับโลกของสื่อสาธารณะได้" แล้วงานของเราก็เลยพลิกมุมโดยไม่คาดคิดมาก่อน
Think of mass media as providing common ground and you have the recipe for taking this idea to a whole new place. We've started analyzing television content using the same principles -- analyzing event structure of a TV signal -- episodes of shows, commercials, all of the components that make up the event structure. And we're now, with satellite dishes, pulling and analyzing a good part of all the TV being watched in the United States. And you don't have to now go and instrument living rooms with microphones to get people's conversations, you just tune into publicly available social media feeds.
ลองนึกถึงสื่อมวลชน ว่าเป็นพี้นที่ส่วนกลางสำหรับเนื้อหาต่างๆ และคุณก็มีสูตร สำหรับนำแนวคิดใหม่นี้ไปใช้ในบริบทใหม่ ตอนนี้เราเริ่มวิเคราะห์เนื้อหาในสื่อโทรทัศน์ โดยใช้วิธีการที่ว่านี้แล้ว เราวิเคราะห์โครงสร้างเหตุการณ์ที่เกิดขึ้นในทีวี รายการตอนต่างๆ โฆษณา ทุกอย่างที่ประกอบกันขึ้นเป็นโครงสร้างของเหตุการณ์ทั้งหมด ตอนนี้เราดึงข้อมูลจากจานดาวเทียมและวิเคราะห์ รายการทีวีทั้งหมดที่คนดูกันในอเมริกา คุณไม่ต้องไปติดตั้งเครื่องมือและไมโครโฟนตามห้องนั่งเล่นในบ้านชาวบ้าน เพื่อเก็บข้อมูลว่าเขาคุยอะไรกัน แค่เก็บข้อมูลตามเครือข่ายสื่อสังคมบนเว็บสาธารณะต่างๆ
So we're pulling in about three billion comments a month, and then the magic happens. You have the event structure, the common ground that the words are about, coming out of the television feeds; you've got the conversations that are about those topics; and through semantic analysis -- and this is actually real data you're looking at from our data processing -- each yellow line is showing a link being made between a comment in the wild and a piece of event structure coming out of the television signal. And the same idea now can be built up. And we get this wordscape, except now words are not assembled in my living room. Instead, the context, the common ground activities, are the content on television that's driving the conversations. And what we're seeing here, these skyscrapers now, are commentary that are linked to content on television. Same concept, but looking at communication dynamics in a very different sphere.
ตอนนี้เราได้ข้อมูลที่ว่า ประมาณสามพันล้านข้อความต่อเดือน แล้วสิ่งมหัศจรรย์ก็เกิดขึ้น คุณมีโครงสร้างของเหตุการณ์ พี้นที่ส่วนกลางที่บรรจุเนื้อหาต่างๆ ที่มาจากโทรทัศน์ แล้วคุณก็มีบทสนทนา ที่เกี่ยวกับหัวข้อต่างๆ เหล่านั้น และจากการวิเคราะห์ความหมาย-- อ้อ ที่คุณเห็นอยู่นี่เป็นข้อมูลจริง จากการประมวลผลข้อมูลของเรานะครับ-- เส้นสีเหลืองแสดงการเชื่อมโยงระหว่าง ข้อความแสดงความเห็นในสื่อทางสังคม กับเนื้อหาในโครงสร้างเหตุการณ์ที่ออกมาจากโทรทัศน์ แนวคิดอันเดียวกัน ได้ถูกนำมาใช้ สร้างภูมิทัศน์ของถ้อยคำ แค่มันไม่ได้เกิดขึ้นในห้องนั่งเล่นของผมเท่านั้นเอง มันอยู่ในบริบทอื่น ในพี้นที่ส่วนกลางของข่าวสาร และกิจกรรมที่มาจากโทรทัศน์ที่ขับเคลื่อนบทสนทนาในสังคม ที่เราเห็นเหมือนตึกระฟ้ามากมายนั่น คือความเห็น ที่เกี่ยวกับเนื้อหาในโทรทัศน์ แนวคิดเดียวกัน แต่เอามาใช้ศึกษาพลวัตการสื่อสาร ในบริบทที่แตกต่างออกไป
And so fundamentally, rather than, for example, measuring content based on how many people are watching, this gives us the basic data for looking at engagement properties of content. And just like we can look at feedback cycles and dynamics in a family, we can now open up the same concepts and look at much larger groups of people. This is a subset of data from our database -- just 50,000 out of several million -- and the social graph that connects them through publicly available sources. And if you put them on one plain, a second plain is where the content lives. So we have the programs and the sporting events and the commercials, and all of the link structures that tie them together make a content graph. And then the important third dimension. Each of the links that you're seeing rendered here is an actual connection made between something someone said and a piece of content. And there are, again, now tens of millions of these links that give us the connective tissue of social graphs and how they relate to content. And we can now start to probe the structure in interesting ways.
ดังนั้น เราจึงเปลี่ยนแปลงอย่างสิ้นเชิง จากการวัดเนื้อหาการสื่อสารจากจำนวนคนที่ดูรายการต่างๆ มาเป็นวิธีนี้ ซึ่งให้ข้อมูลพี้นฐาน ว่าคนมีส่วนร่วมปฏิสัมพันธ์กับเนื้อหาอะไรอย่างไร และเช่นเดียวกับที่เราสามารถศึกษาวงจรของผลป้อนกลับ และพลวัตการสื่อสารที่เกิดขึ้นในครอบครัว เราสามารถใช้หลักการเดียวกันนี้ เพื่อศึกษาคนกลุ่มใหญ่ขึ้นได้ นี่เป็นส่วนหนึ่งของข้อมูลจากฐานข้อมูลของเรา เนื้อหา 50,000 จากเจ็ดล้านชิ้น กับเส้นกราฟที่เชื่อมโยงมัน เข้ากับแหล่งข้อมูลที่อยู่บนเว็บไซต์สาธารณะ ถ้าคุณเอามันมาพลอตบนระนาบ ระนาบที่สองคือตำแหน่งของเนื้อหาข่าวสาร เรามีรายการต่างๆ รายการแข่งขันกีฬา โฆษณา และโครงสร้างที่เชื่อมโยงเนื้อหาเหล่านี้เข้าด้วยกัน นั่นเป็นแผนภาพแสดงเนื้อหา แล้วเราก็มีมิติที่สามซึ่งเป็นส่วนสำคัญ การเชื่อมโยงแต่ละจุดที่คุณเห็นบนจอนี้ คือการเชื่อมโยงที่เกิดขึ้นจริง ระหว่างสิ่งที่คนพูดถึง กับเนื้อหาที่มีการเสนอในโทรทัศน์ เราพบการเชื่อมโยงแบบนี้นับสิบล้านจุด ซึ่งเป็นเส้นใยที่เชื่อมโยงอยู่ภายในสังคม และแสดงความเชื่อมโยงกับเนื้อหาในสื่อ ทีนี้เราก็เริ่มศึกษาโครงสร้างนี้ จากมุมมองที่น่าสนใจได้หลายมุม
So if we, for example, trace the path of one piece of content that drives someone to comment on it, and then we follow where that comment goes, and then look at the entire social graph that becomes activated and then trace back to see the relationship between that social graph and content, a very interesting structure becomes visible. We call this a co-viewing clique, a virtual living room if you will. And there are fascinating dynamics at play. It's not one way. A piece of content, an event, causes someone to talk. They talk to other people. That drives tune-in behavior back into mass media, and you have these cycles that drive the overall behavior.
เช่น ถ้าเราติดตามเส้นทางของ เนื้อหาข่าวสารชิ้นหนึ่ง ที่ทำให้ใครคนหนึ่งแสดงความเห็นเรื่องนี้ แล้วเราก็ติดตามดูว่าความคิดเห็นนั้นมันไปไหนต่อ เราดูแผนภาพของสังคมที่ถูกกระตุ้นด้วยเนื้อหาชิ้นนั้น แล้วสืบย้อนไปดูความสัมพันธ์ ระหว่างแผนภาพทางสังคมกับเนื้อหา เราก็พบแบบแผนโครงสร้างที่น่าสนใจขึ้นมา เราเรียกมันว่ากลุ่มผู้ชมร่วม หรือเรียกว่าเป็นห้องนั่งเล่นในโลกเสมือนจริง ซึ่งมีพลวัตที่น่าสนใจเกิดขึ้น มันไม่ใช่การสื่อสารทางเดียว ที่เนื้อหาหรือเหตุการณ์หนึ่งเป็นเหตุให้คนพูดถึงมัน แต่เมื่อคนพูดถึงเรื่องๆ หนึ่งกับคนอื่น มันก็ขับเคลื่อนพฤติกรรมให้คนเปิดรับสื่อเรื่องนั้นด้วย แล้วคุณก็จะเห็นวงจรนี้ ขับเคลื่อนพฤติกรรมโดยรวมของผู้ชม
Another example -- very different -- another actual person in our database -- and we're finding at least hundreds, if not thousands, of these. We've given this person a name. This is a pro-amateur, or pro-am media critic who has this high fan-out rate. So a lot of people are following this person -- very influential -- and they have a propensity to talk about what's on TV. So this person is a key link in connecting mass media and social media together.
อีกตัวอย่างหนึ่ง อีกมุมที่ต่างออกไปมากเลย เรามุ่งความสนใจไปที่บุคคลคนหนึ่งที่อยู่ในฐานข้อมูล เรามีคนทั้งหมดอย่างน้อยเป็นร้อยหรือเกือบพันคนในฐานข้อมูลนี้ เราเรียกคนคนนี้ ว่าเป็นนักวิจารณ์สื่อมือสมัครเล่นกึ่งอาชีพ ที่มีอัตราการกระจายความเห็นออกไปสูงมาก คนจำนวนมากติดตามคนคนนี้ เขามีอิทธิพลสูงมาก และเขาก็มีแนวโน้มจะคุยกันถึงเรื่องที่อยู่ในทีวี คนคนนี้จึงเป็นกุญแจสำคัญ ที่เชื่อมโยงสื่อมวลชนกับสื่อทางสังคม (Social Media) เข้าด้วยกัน
One last example from this data: Sometimes it's actually a piece of content that is special. So if we go and look at this piece of content, President Obama's State of the Union address from just a few weeks ago, and look at what we find in this same data set, at the same scale, the engagement properties of this piece of content are truly remarkable. A nation exploding in conversation in real time in response to what's on the broadcast. And of course, through all of these lines are flowing unstructured language. We can X-ray and get a real-time pulse of a nation, real-time sense of the social reactions in the different circuits in the social graph being activated by content.
ตัวอย่างสุดท้ายจากข้อมูลนี้ บางครั้ง มันก็อยู่ที่ความพิเศษของเนื้อหาข่าวสารบางชิ้น เราก็เลยไปดูเนื้อหาข่าวอันหนึ่ง การแถลงผลงานของประธานาธิบดีโอบามา เมื่อสองสามสัปดาห์ก่อน ลองดูสิครับว่าเราพบอะไรในฐานข้อมูลนี้ ด้วยหลักการวัดแบบเดิม การมีส่วนร่วมปฏิสัมพันธ์กับเนื้อหาข่าวสารชิ้นนี้ มากมายมหาศาลจนน่าทึ่ง คนอเมริกันทั้งประเทศพูดถึงเรื่องนี้ ในเวลาเดียวกัน กับที่สื่อนำเสนอเนื้อหาชิ้นนี้ และแน่นอน เส้นที่เชื่อมโยงกันเหล่านี้ คือการถ่ายเทของคำพูดที่ไม่มีการจัดโครงสร้างไว้ก่อน เราสามารถถ่ายภาพเอ็กซเรย์ วัดการเคลื่อนไหวของประเทศทั้งประเทศ และปฏิกิริยาตอบสนองทางสังคม ที่เกิดขึ้นในแผนภาพทางสังคม ทันทีที่ถูกกระตุ้นโดยข่าวดังกล่าว
So, to summarize, the idea is this: As our world becomes increasingly instrumented and we have the capabilities to collect and connect the dots between what people are saying and the context they're saying it in, what's emerging is an ability to see new social structures and dynamics that have previously not been seen. It's like building a microscope or telescope and revealing new structures about our own behavior around communication. And I think the implications here are profound, whether it's for science, for commerce, for government, or perhaps most of all, for us as individuals.
ดังนั้น โดยสรุป แนวคิดเรื่องนี้ก็คือ เมื่อโลกของเรามีความก้าวหน้าทางเครื่องไม้เครื่องมือมากขึ้น เราก็สามารถที่จะ เก็บข้อมูลและเชื่อมโยงข้อมูล ระหว่างสิ่งที่ผู้คนพูดคุยกัน กับบริบทหรือสถานที่ที่เขาพูดถึงมัน ทำให้เรามีสามารถ ที่จะมองเห็นโครงสร้างและพลวัตทางสังคมแบบใหม่ ที่เราไม่เคยเห็นมาก่อน เหมือนกับการสร้างกล้องจุลทรรศน์หรือกล้องโทรทรรศน์ ที่เผยให้เราเห็นโครงสร้าง พฤติกรรมการสื่อสารของเรา และผมคิดว่ามันมีความหมายลึกซึ้งมาก ไม่ว่าจะในเชิงวิทยาศาสตร์ เชิงพาณิชย์ ต่อรัฐบาล หรือที่สำคัญที่สุด ต่อเราในฐานะบุคคล
And so just to return to my son, when I was preparing this talk, he was looking over my shoulder, and I showed him the clips I was going to show to you today, and I asked him for permission -- granted. And then I went on to reflect, "Isn't it amazing, this entire database, all these recordings, I'm going to hand off to you and to your sister" -- who arrived two years later -- "and you guys are going to be able to go back and re-experience moments that you could never, with your biological memory, possibly remember the way you can now?" And he was quiet for a moment. And I thought, "What am I thinking? He's five years old. He's not going to understand this." And just as I was having that thought, he looked up at me and said, "So that when I grow up, I can show this to my kids?" And I thought, "Wow, this is powerful stuff."
ผมอยากย้อนกลับมาที่ลูกชายของผมหน่อย ระหว่างที่ผมเตรียมการพูดครั้งนี้ เขามายืนมองอยู่ข้างหลังผม ผมเลยให้เขาดูวิดีโอที่ผมกำลังจะฉายให้คุณดูวันนี้ แล้วผมก็ขออนุญาตเขา ซึ่งเขาก็อนุญาต แล้วผมก็พูดขึ้นมาว่า "มันน่าทึ่งไหม วันหนึ่ง ข้อมูลทั้งหมด วิดีโอทั้งหมดที่ถูกบันทึกไว้นี่ พ่อจะส่งต่อให้ลูกและน้องสาวของลูก" ซึ่งเกิดหลังจากเขาสองปี "แล้วลูกก็จะสามารถย้อนกลับไปสัมผัสช่วงเวลาเหล่านั้น ที่ตอนนั้นลูกไม่สามารถจดจำได้ เพราะข้อจำกัดทางชีวภาพ" เขาเงียบไปพักหนึ่ง ผมนึกในใจว่า "นี่ผมคิดอะไรอยู่เนี่ย? เขาอายุแค่ห้าขวบ เขาคงไม่เข้าใจสิ่งที่ผมพูดหรอก" ขณะที่ผมกำลังคิดอยู่นั่นเอง เขาก็มองผมแล้วพูดว่า "งั้นตอนผมโตขึ้น ผมก็เอาวิดีโอนี่ให้ลูกผมดูได้ใช่ไหมฮะ?" ผมคิดในใจว่า "ว้าว สิ่งนี้มันมีพลังจริงๆ เลย"
So I want to leave you with one last memorable moment from our family. This is the first time our son took more than two steps at once -- captured on film. And I really want you to focus on something as I take you through. It's a cluttered environment; it's natural life. My mother's in the kitchen, cooking, and, of all places, in the hallway, I realize he's about to do it, about to take more than two steps. And so you hear me encouraging him, realizing what's happening, and then the magic happens. Listen very carefully. About three steps in, he realizes something magic is happening, and the most amazing feedback loop of all kicks in, and he takes a breath in, and he whispers "wow" and instinctively I echo back the same. And so let's fly back in time to that memorable moment.
ฉะนั้น ผมเลยอยากทิ้งท้ายไว้ ด้วยภาพช่วงเวลาที่น่าจดจำ จากครอบครัวของเรา นี่คือครั้งแรกที่ลูกชายของเรา เดินได้มากกว่าสองก้าว ซึ่งถูกบันทึกไว้ในวิดีโอ ผมอยากให้คุณสังเกตดีๆ ระหว่างที่ผมให้คุณดูวิดีโอนี้ ในบ้านก็วุ่นๆ ตามธรรมชาติน่ะครับ แม่ผมทำกับข้าวอยู่ในครัว และผมก็อยู่ตรงนั้น ตรงทางเดิน ผมรู้ว่าเขากำลังจะเดิน เขากำลังจะก้าวเดินได้มากกว่าสองก้าว คุณจะได้ยินผมเชียร์ให้เขาเดิน เฝ้ามองสิ่งที่กำลังเกิดขึ้น แล้วสิ่งมหัศจรรย์ก็เกิดขึ้น ฟังดีๆ นะครับ ตอนเขาเดินก้าวที่สาม เขารู้ว่าสิ่งมหัศจรรย์บางอย่างได้เกิดขึ้นแล้ว แล้ววงจรปฏิกิริยาตอบสนองที่น่าทึ่งระหว่างผมกับลูกก็เริ่มขึ้น เขาหายใจเข้า แล้วกระซิบเบาๆ ว่า "ว้าว" แล้วผมก็ตอบสนองกลับไปแบบเดียวกันโดยอัตโนมัติ ตามสัญชาตญาณ เรามาย้อนเวลากลับไปยัง ช่วงเวลาที่น่าจดจำนั้นกันครับ
(Video) DR: Hey. Come here. Can you do it? Oh, boy. Can you do it? Baby: Yeah. DR: Ma, he's walking.
(วิดีโอ) เด็บ: เฮ้ มานี่ซิ ทำได้ไหม? ว่าไงลูก ทำได้ไหม? เด็ก: เย้ เด็บ: แม่ครับ เขาเดินแล้ว
(Laughter)
(เสียงหัวเราะ)
(Applause)
(เสียงปรบมือ)
DR: Thank you.
เด็บ: ขอบคุณครับ
(Applause)
(เสียงปรบมือ)