In ancient Greece, when anyone from slaves to soldiers, poets and politicians, needed to make a big decision on life's most important questions, like, "Should I get married?" or "Should we embark on this voyage?" or "Should our army advance into this territory?" they all consulted the oracle.
Ở Hy Lạp cổ đại, bất cứ ai từ nô lệ đến người lính, nhà thơ và chính khách, đều cần phải đưa ra một quyết định lớn cho các câu hỏi quan trọng trong đời, như, "Tôi có nên kết hôn?" hay "Ta có nên tham gia chuyến đi này?" hay "Quân ta có nên tiến vào vùng lãnh thổ này?" họ đều tham vấn nhà tiên tri.
So this is how it worked: you would bring her a question and you would get on your knees, and then she would go into this trance. It would take a couple of days, and then eventually she would come out of it, giving you her predictions as your answer.
Và cách làm như sau: bạn đem đến cho bà ấy một câu hỏi và quỳ gối chờ, và rồi bà ấy sẽ chuyển sang nhập định. Kéo dài trong vài ngày, và cuối cùng bà ấy sẽ bình thường trở lại, và cho bạn những tiên đoán cũng như là câu trả lời.
From the oracle bones of ancient China to ancient Greece to Mayan calendars, people have craved for prophecy in order to find out what's going to happen next. And that's because we all want to make the right decision. We don't want to miss something. The future is scary, so it's much nicer knowing that we can make a decision with some assurance of the outcome.
Từ những mẫu xương nhà tiên tri của Trung quốc cổ đại đến Hy Lạp cổ đại đến lịch Maya, con người khao khát những lời tiên tri để biết được điều gì sẽ xãy ra tiếp theo. Và đó là bởi vì tất cả chúng ta đều muốn đưa ra quyết định đúng, Ta không muốn bỏ lỡ điều gì. Tương lai thật đáng sợ, và sẽ dễ chịu hơn khi biết ta có thể đưa ra một quyết định mà có sự chắc chắn nhất định về kết quả.
Well, we have a new oracle, and it's name is big data, or we call it "Watson" or "deep learning" or "neural net." And these are the kinds of questions we ask of our oracle now, like, "What's the most efficient way to ship these phones from China to Sweden?" Or, "What are the odds of my child being born with a genetic disorder?" Or, "What are the sales volume we can predict for this product?"
Vâng, ta có một nhà tiên tri mới, có tên là dữ liệu lớn, ta có thể gọi nó là "Watson" hay "học máy" hay "mạng nơ rôn." Và đây là những loại câu hỏi mà giờ đây ta có thể hỏi nhà tiên tri của chúng ta, như, "Cách nào hiệu quả nhất để chuyển những chiếc điện thoại từ Trung Quốc đến Thụy Điển?" Hay, "Con tôi sinh ra có tỷ lệ bị rối loạn di truyền là bao nhiêu?" Hay, "Ta có thể dự đoán doanh số của sản phẩm này là bao nhiêu?"
I have a dog. Her name is Elle, and she hates the rain. And I have tried everything to untrain her. But because I have failed at this, I also have to consult an oracle, called Dark Sky, every time before we go on a walk, for very accurate weather predictions in the next 10 minutes. She's so sweet. So because of all of this, our oracle is a $122 billion industry.
Tôi có một con chó. Tên nó là Elle, và nó rất ghét trời mưa. Và tôi đã tìm mọi cách để giúp nó hết sợ. Nhưng tôi đã thất bại, nên tôi đã tham vấn một nhà tiên tri, được gọi là Dark Sky, trước mỗi lúc chúng tôi đi dạo bộ, để có được các dự báo thời tiết chính xác trong 10 phút tới. Cô ấy thật ngọt ngào. Bởi tất cả những điều đó, nhà tiên tri của ta là một ngành công nghiệp 122 tỷ đô.
Now, despite the size of this industry, the returns are surprisingly low. Investing in big data is easy, but using it is hard. Over 73 percent of big data projects aren't even profitable, and I have executives coming up to me saying, "We're experiencing the same thing. We invested in some big data system, and our employees aren't making better decisions. And they're certainly not coming up with more breakthrough ideas."
Giờ đây, bất chấp kích cỡ của ngành công nghiệp này, kết quả mang lại vẫn thấp một cách ngạc nhiên. Đầu tư vào dữ liệu lớn rất dễ dàng, nhưng sử dụng nó mới khó. Thậm chí, hơn 73 phần trăm các dự án dữ liệu lớn không đem lại lợi nhuận, và nhiều vị giám đốc đến gặp tôi và nói rằng, "Chúng tôi đang gặp vấn đề giống nhau, Đều đầu tư một hệ thống dữ liệu lớn, và nhân viên vẫn không đưa ra được các quyết định tốt hơn. Và chắc chắn là họ không đưa ra được các ý tưởng đột phá hơn."
So this is all really interesting to me, because I'm a technology ethnographer. I study and I advise companies on the patterns of how people use technology, and one of my interest areas is data. So why is having more data not helping us make better decisions, especially for companies who have all these resources to invest in these big data systems? Why isn't it getting any easier for them?
Tất cả điều này thực sự thú vị với tôi, vì tôi là nhà dân tộc học về công nghệ Tôi nghiên cứu và cố vấn cho các công ty về các mô hình sử dụng công nghệ, và một trong các lĩnh vực mà tôi quan tâm là dữ liệu. Tại sao có thêm nhiều dữ liệu cũng không giúp ta đưa ra các quyết định tốt hơn, đặc biệt đối với các công ty có đủ nguồn lực để đầu tư các hệ thống dữ liệu lớn? Tại sao nó không trở nên dễ dàng hơn?
So, I've witnessed the struggle firsthand. In 2009, I started a research position with Nokia. And at the time, Nokia was one of the largest cell phone companies in the world, dominating emerging markets like China, Mexico and India -- all places where I had done a lot of research on how low-income people use technology. And I spent a lot of extra time in China getting to know the informal economy. So I did things like working as a street vendor selling dumplings to construction workers. Or I did fieldwork, spending nights and days in internet cafés, hanging out with Chinese youth, so I could understand how they were using games and mobile phones and using it between moving from the rural areas to the cities.
Tôi đã chứng kiến sự khó khăn đầu tiên. Năm 2009, tôi bắt đầu một vị trí nghiên cứu với Nokia. Và vào lúc đó, Nokia là 1 trong các công ty điện thoại di động lớn nhất thế giới, thống trị các thị trường mới nổi như Trung Quốc, Mexico và Ấn Độ-- những nơi đó tôi đã thực hiện nhiều nghiên cứu về cách những người thu nhập thấp sử dụng công nghệ. Và tôi cũng đã dành nhiều thời gian ở Trung Quốc để tìm hiểu nền kinh tế phi chính thức. Tôi đã làm những việc như bán hàng rong bán bánh bao cho công nhân xây dựng. Hay tôi đi thực tế, dành cả ngày lẫn đêm trong các quán cà phê internet, đi chơi với thanh niên Trung Quốc, nên tôi có thể hiểu họ đã sử dụng điện thoại và chơi game ra sao và sử dụng khi di chuyển giữa nông thôn và thành thị.
Through all of this qualitative evidence that I was gathering, I was starting to see so clearly that a big change was about to happen among low-income Chinese people. Even though they were surrounded by advertisements for luxury products like fancy toilets -- who wouldn't want one? -- and apartments and cars, through my conversations with them, I found out that the ads the actually enticed them the most were the ones for iPhones, promising them this entry into this high-tech life. And even when I was living with them in urban slums like this one, I saw people investing over half of their monthly income into buying a phone, and increasingly, they were "shanzhai," which are affordable knock-offs of iPhones and other brands. They're very usable. Does the job.
Dựa trên những dữ liệu định tính mà tôi đã thu thập được này, Tôi đã bắt đầu nhận ra rằng sắp diễn ra một sự thay đổi lớn giữa những người Trung Quốc thu nhập thấp. Ngay cả khi họ bị bủa vây bởi những quảng cáo cho các sản phẩm xa xỉ như thiết bị vệ sinh ưa thích-- ai mà không muốn một cái? rồi căn hộ và xe hơi, qua tiếp xúc với họ, Tôi khám phá ra rằng những quảng cáo thực sự lôi cuốn họ nhất là những cái quảng cáo về iPhones, hứa hẹn họ cánh cửa này dẫn vào cuộc sống công nghệ cao. Và ngay cả khi tôi sống với họ trong các khu ổ chuột như cái này, Tôi thấy mọi người chi quá nữa thu nhập hàng tháng của họ để mua điện thoại, và hàng nhái "shanzhai" ngày càng nhiều, giá cả dễ mua đánh bật iPhones và các nhãn hiệu khác. Những thứ này dùng được. Được chấp nhận.
And after years of living with migrants and working with them and just really doing everything that they were doing, I started piecing all these data points together -- from the things that seem random, like me selling dumplings, to the things that were more obvious, like tracking how much they were spending on their cell phone bills. And I was able to create this much more holistic picture of what was happening. And that's when I started to realize that even the poorest in China would want a smartphone, and that they would do almost anything to get their hands on one.
Sau nhiều năm sống với những người nhập cư và làm việc với họ và làm mọi thứ họ làm, Tôi bắt đầu kết nối tất cả dữ liệu lại với nhau-- từ những thứ tưởng như ngẫu nhiên, như tôi đi bán bánh bao, đến những thứ rõ ràng hơn, như tìm hiểu họ đã chi tiêu bao nhiêu cho hóa đơn điện thoại. Và tôi đã tạo ra bức tranh toàn diện hơn rất nhiều này về những gì đang xảy ra. Và đó cũng là lúc tôi bắt đầu nhận ra ngay cả những người Trung Quốc nghèo nhất cũng muốn điện thoại thông minh, và họ làm gần như mọi thứ để có được một cái trên tay.
You have to keep in mind, iPhones had just come out, it was 2009, so this was, like, eight years ago, and Androids had just started looking like iPhones. And a lot of very smart and realistic people said, "Those smartphones -- that's just a fad. Who wants to carry around these heavy things where batteries drain quickly and they break every time you drop them?" But I had a lot of data, and I was very confident about my insights, so I was very excited to share them with Nokia.
Bạn cần nhớ rằng, iPhones chỉ mới xuất hiện, vào năm 2009, mới khoảng tám năm trước, và Android cũng bắt đầu trông giống iPhones. Và rất nhiều người thực tế và thông minh đã nói, Điện thoại thông minh -- ở thời điểm đó. Có ai muốn mang theo những thứ nặng nề đó trong khi Pin thì nhanh hết và sẽ bị vỡ mỗi khi ta làm rơi chúng? Và tôi có nhiều dữ liệu, tôi rất tự tin về những phát hiện của mình, tôi đã rất hào hứng chia sẻ với Nokia.
But Nokia was not convinced, because it wasn't big data. They said, "We have millions of data points, and we don't see any indicators of anyone wanting to buy a smartphone, and your data set of 100, as diverse as it is, is too weak for us to even take seriously." And I said, "Nokia, you're right. Of course you wouldn't see this, because you're sending out surveys assuming that people don't know what a smartphone is, so of course you're not going to get any data back about people wanting to buy a smartphone in two years. Your surveys, your methods have been designed to optimize an existing business model, and I'm looking at these emergent human dynamics that haven't happened yet. We're looking outside of market dynamics so that we can get ahead of it." Well, you know what happened to Nokia? Their business fell off a cliff. This -- this is the cost of missing something. It was unfathomable.
Nhưng đã không thuyết phục được Nokia, bởi vì đó không phải là dữ liệu lớn. Họ nói, "Chúng tôi có hàng triệu mục dữ liệu, và chúng tôi không thấy chỉ dấu nào rằng có người muốn mua điện thoại thông minh, và tập dữ liệu của bạn chỉ có 100, mức độ đa dạng của nó quá yếu để chúng tôi xem xét nghiêm túc." Và tôi nói, "Nokia, các bạn đúng. Tất nhiên các bạn sẽ không thấy, bởi vì bạn thực hiện các khảo sát giả định rằng mọi người không biết về điện thoại thông minh và dĩ nhiên bạn sẽ không có được bất kỳ dữ liệu về người muốn mua điện thoại thông minh cho 2 năm tới. Phương pháp khảo sát của bạn được thiết kế để tối ưu mô hình kinh doanh hiện tại, và tôi đang nhắm đến những động lực con người mới nổi mà chưa xuất hiện. Chúng ta đang ra bên ngoài các động lực thị trường để có thể đón đầu nó." Vâng, các bạn biết những gì đã xãy ra với Nokia? Kinh doanh của họ đã rơi thẳng đứng. Đây là cái giá của việc thiếu sót thứ gì đó. Không thể hiểu được.
But Nokia's not alone. I see organizations throwing out data all the time because it didn't come from a quant model or it doesn't fit in one. But it's not big data's fault. It's the way we use big data; it's our responsibility. Big data's reputation for success comes from quantifying very specific environments, like electricity power grids or delivery logistics or genetic code, when we're quantifying in systems that are more or less contained.
Nhưng không phải chỉ mình Nokia. Tôi thấy các tổ chức luôn vứt bỏ các dữ liệu bởi vì nó không xuất phát từ một mô hình phân tích hay không khớp với nó. Nhưng đó không phải lỗi của dữ liệu lớn. Mà ở cách chúng ta sử dụng dữ liệu lớn; đó là lỗi của chúng ta. Thành công nổi tiếng của dữ liệu lớn đến từ việc định lượng hóa mọi điều kiện môi trường cụ thể như các lưới điện hay hạ tầng giao vận hay mã di truyền, khi chúng ta đang định lượng trong các hệ thống mà hay ít nhiều có kiểm soát.
But not all systems are as neatly contained. When you're quantifying and systems are more dynamic, especially systems that involve human beings, forces are complex and unpredictable, and these are things that we don't know how to model so well. Once you predict something about human behavior, new factors emerge, because conditions are constantly changing. That's why it's a never-ending cycle. You think you know something, and then something unknown enters the picture. And that's why just relying on big data alone increases the chance that we'll miss something, while giving us this illusion that we already know everything.
Nhưng không phải mọi hệ thống đều được kiểm soát rõ ràng. Khi chúng ta đang định lượng và các hệ thống thì năng động hơn, đặc biệt là các hệ thống liên quan đến yếu tố con người, các động lực rất phức tạp và khó đoán, và đây là những thứ mà chúng ta không biết cách để mô hình hóa cho tốt Một khi bạn dự đoán điều gì đó về hành vi con người, các yếu tố mới xuất hiện, bởi vì các điều kiện luôn thay đổi. Do đó nó là một chu trình vô tận. Bạn nghĩ bạn biết điều gì đó, và rồi điều chưa biết lại xuất hiện. Đó là lý do nếu chỉ dựa vào dữ liệu lớn sẽ làm tăng xác suất chúng ta sẽ bỏ nhỡ điều gì đó, trong khi làm cho chúng ta ảo tưởng rằng chúng ta đã biết mọi thứ.
And what makes it really hard to see this paradox and even wrap our brains around it is that we have this thing that I call the quantification bias, which is the unconscious belief of valuing the measurable over the immeasurable. And we often experience this at our work. Maybe we work alongside colleagues who are like this, or even our whole entire company may be like this, where people become so fixated on that number, that they can't see anything outside of it, even when you present them evidence right in front of their face. And this is a very appealing message, because there's nothing wrong with quantifying; it's actually very satisfying. I get a great sense of comfort from looking at an Excel spreadsheet, even very simple ones.
Và điều gì làm cho việc nhận ra nghịch lý này khó khăn đến vậy và ngay cả để hiểu nó chúng ta đa gặp phải cái mà tôi gọi là thiên vị định lượng, đó là niềm tin vô thức về giá trị của những cái đo lường được so với cái không đo lường được. Và chúng ta thường trải nghiệm điều này khi làm việc. Có thể chúng ta làm việc bên cạnh đồng nghiệp như vậy, hoặc có thể cả công ty của chúng ta cũng như vậy, nơi mà mọi người mặc nhiên tin vào con số đó, họ không thể nhìn thấy cái gì ngoài nó ra, ngay cả khi bạn cho họ thấy bằng chứng ngay trước mặt họ. Vầ đây là một thông điệp rất lôi cuốn, bởi vì chẳng có gì sai với việc định lượng hóa; Nó thực sự rất thỏa mãn. Tôi có một cảm giác rất thoải mái khi nhìn vào một bảng tính Excel, cho dù nó rát đơn giản.
(Laughter)
(Cười)
It's just kind of like, "Yes! The formula worked. It's all OK. Everything is under control."
Nó có phần giống như, "Vâng! Công thức đúng. Tất cả đều ổn. Mọi thứ đang được kiểm soát."
But the problem is that quantifying is addictive. And when we forget that and when we don't have something to kind of keep that in check, it's very easy to just throw out data because it can't be expressed as a numerical value. It's very easy just to slip into silver-bullet thinking, as if some simple solution existed. Because this is a great moment of danger for any organization, because oftentimes, the future we need to predict -- it isn't in that haystack, but it's that tornado that's bearing down on us outside of the barn. There is no greater risk than being blind to the unknown. It can cause you to make the wrong decisions. It can cause you to miss something big.
Nhưng vấn đề là Việc định lượng hóa gây nghiện. Và khi chúng ta quên mất rằng khi chúng ta không có cái gì để giữ chúng trong tầm kiểm soát, Chúng ta rất dễ đánh mất dữ liệu bởi vì nó không thể được biểu diễn như một giá trị số học. Nó làm cho ta rất dễ rơi vào tư duy xử lý tình thế, như là một giải pháp đơn giản tồn tại. Bởi vì đây là thời điểm vô cùng nguy hiểm cho bất kỳ tổ chức nào, bởi vì thường là, chúng ta cần dự đoán tương lai -- không giống như trong đống rơm mà nó như là cơn lốc xoáy đổ xuống đầu chúng ta bên ngoài lều trại. Không có rủi ro nào lớn hơn là bị mù với những thứ chưa biết. Nó có thể làm cho bạn đưa ra quyết định sai. Nó có thể làm bạn bỏ lỡ những điều to lớn.
But we don't have to go down this path. It turns out that the oracle of ancient Greece holds the secret key that shows us the path forward. Now, recent geological research has shown that the Temple of Apollo, where the most famous oracle sat, was actually built over two earthquake faults. And these faults would release these petrochemical fumes from underneath the Earth's crust, and the oracle literally sat right above these faults, inhaling enormous amounts of ethylene gas, these fissures.
Nhưng chúng ta không cần phải đi theo con đường này. Hóa ra những nhà tiên tri của Hy Lạp cổ đại nắm giữ chìa khóa bí mật chỉ cho ta con đường đi về phía trước. Hiện nay, nghiên cứu địa chất gần đây chỉ ra rằng ngôi đền Apollo, nơi nhà tiên tri nổi tiếng nhất ngồi, được xây dựng trên hai đoạn đứt gãy động đất. Và những đoạn đứt gãy này bốc ra hơi hóa dầu từ bên dưới lớp vỏ Trái đất, và nhà tiên tri ngồi chính xác ngay trên chổ đứt gãy này, hít vào lượng lớn khí Etylen ở chỗ vết nứt này.
(Laughter)
(Cười)
It's true.
Sự thật là như vậy.
(Laughter) It's all true, and that's what made her babble and hallucinate and go into this trance-like state. She was high as a kite!
(Cười) Tất cả là sự thật, và nó làm cho bà ấy nói nhảm và ảo giác và chuyển sang trạng thái xuất thần Bà ta bay bổng như chiếc diều!
(Laughter)
(Cười)
So how did anyone -- How did anyone get any useful advice out of her in this state? Well, you see those people surrounding the oracle? You see those people holding her up, because she's, like, a little woozy? And you see that guy on your left-hand side holding the orange notebook? Well, those were the temple guides, and they worked hand in hand with the oracle. When inquisitors would come and get on their knees, that's when the temple guides would get to work, because after they asked her questions, they would observe their emotional state, and then they would ask them follow-up questions, like, "Why do you want to know this prophecy? Who are you? What are you going to do with this information?" And then the temple guides would take this more ethnographic, this more qualitative information, and interpret the oracle's babblings. So the oracle didn't stand alone, and neither should our big data systems.
Vậy làm sao người ta-- Làm sao người ta xin lời khuyên hữu dụng từ bà ấy trong trạng thái này? Vâng, bạn thấy những người đó vây quanh bà? Bạn thấy những người đó nâng bà ấy lên, Vì bà ấy giống như một người say? Và bạn thấy cái gã bên tay trái đang cầm quyển vở màu cam? Đó là những người hướng dẫn đền, và họ làm việc cùng với nhà tiên tri. Khi những người xin lời khuyên đến và quỳ gối, đó là lúc người hướng dẫn đền làm việc, vì sau khi người ta đặt câu hỏi cho bà, người ta sẽ quan sát trạng thái cảm xúc, và khi họ hỏi những câu hỏi tiếp theo, như, "Tại sao các người muốn biết điều này? Các người là ai? Các người sẽ làm gì với thông tin này?" Và rồi người hướng dẫn đền sẽ lấy thông tin nhân chủng học, thông tin định tính, và dịch những lời nói nhảm của tiên tri. Vậy ra nhà tiên tri không đơn độc, và không như các hệ thống dữ liệu lớn của ta.
Now to be clear, I'm not saying that big data systems are huffing ethylene gas, or that they're even giving invalid predictions. The total opposite. But what I am saying is that in the same way that the oracle needed her temple guides, our big data systems need them, too. They need people like ethnographers and user researchers who can gather what I call thick data. This is precious data from humans, like stories, emotions and interactions that cannot be quantified. It's the kind of data that I collected for Nokia that comes in in the form of a very small sample size, but delivers incredible depth of meaning.
Bây giờ đã rõ, Tôi không nói rằng các hệ thống dữ liệu lớn đang thổi khí Etylen, hay chúng đang cung cấp các dự đoán sai. Hoàn toàn ngược lại. Nhưng điều tôi đang nói là giống như cách nhà tiên tri cần những người hướng dẫn đền của bà ấy, các hệ thống dữ liệu lớn cũng cần họ. Chúng cần những nhà nhân chủng học, nhà nghiên cứu người dùng họ có thể thu thập cái gọi là dữ liệu dày. Đây là dữ liệu quý giá từ con người, như những câu chuyện, cảm xúc và những tương tác mà không thể lượng hóa được. Đó là loại dữ liệu mà tôi đã thu thập cho Nokia nó thể hiện dưới dạng có kích thước mẫu rất nhỏ, nhưng chuyển tải độ sâu ý nghĩa không thể tin được.
And what makes it so thick and meaty is the experience of understanding the human narrative. And that's what helps to see what's missing in our models. Thick data grounds our business questions in human questions, and that's why integrating big and thick data forms a more complete picture. Big data is able to offer insights at scale and leverage the best of machine intelligence, whereas thick data can help us rescue the context loss that comes from making big data usable, and leverage the best of human intelligence. And when you actually integrate the two, that's when things get really fun, because then you're no longer just working with data you've already collected. You get to also work with data that hasn't been collected. You get to ask questions about why: Why is this happening?
Và điều làm cho nó mang nhiều ý nghĩa là sự trải nghiệm thấu hiểu những câu chuyện về con người. Nó giúp ta nhìn thấy những thiếu sót trong các mô hình của chúng ta. Dữ liệu dày làm nền tảng cho những câu hỏi kinh doanh theo những câu hỏi con người, và đó là lý do việc tích hợp dữ liệu dày và dữ liệu lớn tạo nên một bức tranh đầy đủ hơn. Dữ liệu lớn có thể đem đến những thông tin theo quy mô và tận dụng tối đa trí tuệ của máy, trong khi dữ liệu dày có thể giúp ta cứu vớt những mất mát ngữ cảnh mà để làm cho dữ liệu lớn có thể dùng được, và tối đa hóa trí tuệ con người. Và khi bạn tích hợp hai loại đó lại, lúc đó mọi thứ sẽ rất thú vị, bởi vì bạn không còn chỉ làm việc với dữ liệu mà bạn đã thu thập sẵn. Bạn sẽ cần làm việc với dữ liệu mà chưa được thu thập. Bạn cần hỏi những câu tại sao: Tại sao điều này xảy ra?
Now, when Netflix did this, they unlocked a whole new way to transform their business. Netflix is known for their really great recommendation algorithm, and they had this $1 million prize for anyone who could improve it. And there were winners. But Netflix discovered the improvements were only incremental. So to really find out what was going on, they hired an ethnographer, Grant McCracken, to gather thick data insights. And what he discovered was something that they hadn't seen initially in the quantitative data. He discovered that people loved to binge-watch. In fact, people didn't even feel guilty about it. They enjoyed it.
Khi Netflix làm điều này, họ đã mở ra một con đường hoàn toàn mới để thay đổi việc làm ăn. Netflix được biết đến với giải thuật khuyến nghị tuyệt vời của họ, và họ đã treo giải 1 triệu đô cho ai có thể cải thiện nó. Đây, những người đoạt giải. Nhưng Netflix khám phá ra rằng sự cải tiến chỉ giúp tăng dần. Để tìm ra điều gì đang thực sự diễn ra, họ thuê một nhà nhân chủng học, Grant McCracken, để tập hợp ý nghĩa dữ liệu dày. Và ông ấy đã khám phá ra là có điều gì đó mà họ đã không nhận thấy ngay từ đầu trong dữ liệu định lượng. Ông khám phá ra rằng mọi người thích xem quá độ. Nhưng người ta không cảm thấy có lỗi về điều đó. Họ thưởng thức nó.
(Laughter)
(Cười)
So Netflix was like, "Oh. This is a new insight." So they went to their data science team, and they were able to scale this big data insight in with their quantitative data. And once they verified it and validated it, Netflix decided to do something very simple but impactful. They said, instead of offering the same show from different genres or more of the different shows from similar users, we'll just offer more of the same show. We'll make it easier for you to binge-watch. And they didn't stop there. They did all these things to redesign their entire viewer experience, to really encourage binge-watching. It's why people and friends disappear for whole weekends at a time, catching up on shows like "Master of None." By integrating big data and thick data, they not only improved their business, but they transformed how we consume media. And now their stocks are projected to double in the next few years.
Netflix tiếp nhận kiểu, "Ồ, đây là cách nhìn mới." Và họ đã gặp đội khoa học dữ liệu của họ, và họ có thể điều chỉnh tỉ lệ ý nghĩa dữ liệu lớn cùng với dữ liệu định lượng của họ. Và khi đã xác minh và xác nhận nó, Netflix đã quyết định làm điều gì đó rất đơn giản nhưng có ảnh hưởng lớn. Họ nói, thay vì chào mời cùng chương trình đến các giới tính khác nhau hay tăng các chương trình khác nhau đến cùng lớp người dùng, chúng tôi sẽ tăng chào mời cùng loại chương trình. Chúng tôi sẽ giúp bạn xem quá độ dễ dàng hơn. Và họ không dừng ở đó. Họ đã làm tất cả những điều đó để thiết kế lại toàn bộ trải nghiệm cho người xem, để thực sự khuyến khích xem quá độ. Đó là lý do mọi người và bạn bè biến mất cả cuối tuần cùng lúc, theo dõi các chương trình như "Không thông thạo." Việc tích hợp dữ liệu lớn và dữ liệu dày, họ đã không chỉ cải thiện việc kinh doanh, nhưng họ còn thay đổi cách chúng ta tiêu dùng truyền thông. Và giờ đây kho hàng của họ được dự báo sẽ gấp đôi trong vài năm đến.
But this isn't just about watching more videos or selling more smartphones. For some, integrating thick data insights into the algorithm could mean life or death, especially for the marginalized. All around the country, police departments are using big data for predictive policing, to set bond amounts and sentencing recommendations in ways that reinforce existing biases. NSA's Skynet machine learning algorithm has possibly aided in the deaths of thousands of civilians in Pakistan from misreading cellular device metadata. As all of our lives become more automated, from automobiles to health insurance or to employment, it is likely that all of us will be impacted by the quantification bias.
Nhưng đây không chỉ là xem nhiều phim hơn hay bán nhiều điện thoại hơn. Đối với một số người, tích hợp ý nghĩa dữ liệu dày và giải thuật có ý nghĩa sống còn, đặc biệt những người bị gạt ra khỏi cuộc chơi. Trên khắp đất nước, các sở cảnh sát đang sử dụng dữ liệu lớn cho việc giữ trật tự có dự báo, để thiết lập mức bảo lãnh và các khuyến nghị hình phạt theo nhiều cách để củng cố lại các thiên vị đang tồn tại. Máy giải thuật học của NSA's Skynet có thể đã góp phần vào những cái chết của hàng ngàn thường dân vô tội ở Pakistan vì đọc sai dữ liệu mô tả thiết bị di động. Khi cuộc sống chúng ta trở nên tự động hóa hơn, từ xe ô tô đến bảo hiểm y tế, hay việc làm, có vẻ như rằng tất cả chúng ta sẽ bị ảnh hưởng bởi sự thiên vị định lượng.
Now, the good news is that we've come a long way from huffing ethylene gas to make predictions. We have better tools, so let's just use them better. Let's integrate the big data with the thick data. Let's bring our temple guides with the oracles, and whether this work happens in companies or nonprofits or government or even in the software, all of it matters, because that means we're collectively committed to making better data, better algorithms, better outputs and better decisions. This is how we'll avoid missing that something.
Giờ đây, tin tốt là chúng ta đã đi một chặng đường dài từ hít phải khí Etylen đến việc đưa ra các dự báo. Chúng ta có các công cụ tốt hơn, nên hãy sử dụng chúng tốt hơn. Ta hãy tích hợp dữ liệu lớn cùng với dữ liệu dày. Hãy đem người hướng dẫn đền đến với nhà tiên tri và cho dù việc này xãy ra ở công ty hay các tổ chức phi lợi nhuận hay chính phủ hay ngay cả trong phần mềm, tất cả chúng đều quan trọng, bởi vì nó có nghĩa chúng ta đã cam kết một cách tập thể để tạo ra dữ liệu tốt hơn, các giải thuật tốt hơn, kết quả tốt hơn và các quyết định tốt hơn. Đây là cách chúng ta sẽ tránh bỏ lỡ những thứ quan trọng đó.
(Applause)
(Vỗ tay)