Kenneth Cukier: Big data is better data

America's favorite pie is?

Loại bánh ưa thích tại Mỹ là ?

Audience: Apple. Kenneth Cukier: Apple. Of course it is. How do we know it? Because of data. You look at supermarket sales. You look at supermarket sales of 30-centimeter pies that are frozen, and apple wins, no contest. The majority of the sales are apple. But then supermarkets started selling smaller, 11-centimeter pies, and suddenly, apple fell to fourth or fifth place. Why? What happened? Okay, think about it. When you buy a 30-centimeter pie, the whole family has to agree, and apple is everyone's second favorite. (Laughter) But when you buy an individual 11-centimeter pie, you can buy the one that you want. You can get your first choice. You have more data. You can see something that you couldn't see when you only had smaller amounts of it.

Khán giả: Bánh táo. Kenneth Cukier: Bánh táo. Tất nhiên rồi. Làm sao ta biết được? Nhờ có dữ liệu. Nhìn vào doanh số bán hàng siêu thị. Nhìn vào doanh số bán của các loại bánh đường kính 30cm được đông lạnh, và bánh táo thắng tuyệt đối. Phần lớn bánh bán ra là bánh táo. Nhưng đến khi các siêu thị bắt đầu bán loại nhỏ hơn, cỡ 11 cm, thì đột nhiên, bánh táo tụt xuống hạng tư hay năm. Tại sao? Điều gì đã xảy ra? Hãy cùng suy nghĩ về điều này. Khi bạn mua bánh cỡ 30 cm, cả gia đình bạn phải đồng ý, thực tế, bánh táo chỉ đứng thứ hai trong danh sách yêu thích của mọi người. (tiếng cười) Nhưng khi mua một cái bánh cỡ 11 cm, bạn có thể mua cái mà bạn muốn. Bạn có thể mua loại mà mình thích nhất. Bạn có nhiều dữ liệu hơn. Bạn có thể thấy được những thứ không thể thấy khi chỉ có một lượng nhỏ dữ liệu. Điểm mấu chốt ở đây là, có nhiều dữ liệu hơn

Now, the point here is that more data doesn't just let us see more, more of the same thing we were looking at. More data allows us to see new. It allows us to see better. It allows us to see different. In this case, it allows us to see what America's favorite pie is: not apple.

không những giúp ta thấy nhiều hơn, nhiều hơn về thứ ta đang nhìn. Nhiều dữ liệu hơn còn giúp ta thấy được những điều mới, mang đến một góc nhìn tốt hơn, cho phép ta thấy khác đi. Trong trường hợp này, nó cho phép ta thấy thứ bánh nào được ưa chuộng ở Mỹ: không phải bánh táo. Các bạn chắc hẳn đã từng nghe về khái niệm big data (dữ liệu lớn).

Now, you probably all have heard the term big data. In fact, you're probably sick of hearing the term big data. It is true that there is a lot of hype around the term, and that is very unfortunate, because big data is an extremely important tool by which society is going to advance. In the past, we used to look at small data and think about what it would mean to try to understand the world, and now we have a lot more of it, more than we ever could before. What we find is that when we have a large body of data, we can fundamentally do things that we couldn't do when we only had smaller amounts. Big data is important, and big data is new, and when you think about it, the only way this planet is going to deal with its global challenges — to feed people, supply them with medical care, supply them with energy, electricity, and to make sure they're not burnt to a crisp because of global warming — is because of the effective use of data.

Đúng hơn, hẳn các bạn đã chán ngấy về nó. Thật đúng khi cho rằng có nhiều sự thổi phồng xung quanh khái niệm trên, và điều đó thật đáng tiếc, vì big data là một công cụ cực kì quan trọng mà nhờ đó, xã hội sẽ trở nên tiến bộ hơn. Trong quá khứ, chúng ta thường nhìn vào những dữ liệu nhỏ, tìm hiểu ý nghĩa của chúng, để cố gắng hiểu về thế giới, và giờ, ta có nhiều dữ liệu hơn, nhiều hơn bao giờ hết. Những gì ta biết là khi có một lượng lớn dữ liệu, ta có thể làm những điều mà trước kia không thể. Dữ liệu lớn rất quan trọng, và mới mẻ, và đó có thể là cách duy nhất mà hành tinh này sẽ đối phó với những thử thách toàn cầu: đảm bảo thức ăn cho mọi người, cung cấp dịch vụ y tế, cung cấp năng lượng, điện, và đảm bảo người dân không bị thiêu rụi bởi sự nóng lên toàn cầu - tất cả nhờ vào việc sử dụng dữ liệu hiệu quả. Vậy thì, có gì mới về dữ liệu lớn? Có gì mà to tát vậy chứ?

So what is new about big data? What is the big deal? Well, to answer that question, let's think about what information looked like, physically looked like in the past. In 1908, on the island of Crete, archaeologists discovered a clay disc. They dated it from 2000 B.C., so it's 4,000 years old. Now, there's inscriptions on this disc, but we actually don't know what it means. It's a complete mystery, but the point is that this is what information used to look like 4,000 years ago. This is how society stored and transmitted information.

Được, để trả lời câu hỏi đó, hãy nghĩ về thông tin trông như thế nào, trước kia. Vào năm 1908, trên đảo Crete, các nhà khảo cổ học tìm ra một cái đĩa đất sét. Họ xác định nó từ là 2000 năm trước Công nguyên, vậy nó 4000 tuổi. Có chữ khắc trên tấm đĩa, nhưng ta không hiểu nó có nghĩa gì. Hoàn toàn là một bí ẩn, nhưng vấn đề là thông tin đã từng trông như thế 4000 năm trước. Đây là cách xã hội lưu trữ và truyền tải thông tin. Bây giờ, xã hội chưa tân tiến đến mức đó.

Now, society hasn't advanced all that much. We still store information on discs, but now we can store a lot more information, more than ever before. Searching it is easier. Copying it easier. Sharing it is easier. Processing it is easier. And what we can do is we can reuse this information for uses that we never even imagined when we first collected the data. In this respect, the data has gone from a stock to a flow, from something that is stationary and static to something that is fluid and dynamic. There is, if you will, a liquidity to information. The disc that was discovered off of Crete that's 4,000 years old, is heavy, it doesn't store a lot of information, and that information is unchangeable. By contrast, all of the files that Edward Snowden took from the National Security Agency in the United States fits on a memory stick the size of a fingernail, and it can be shared at the speed of light. More data. More.

Chúng ta vẫn lưu trữ thông tin trên đĩa, nhưng giờ, có thể lưu trữ nhiều thông tin hơn trước kia. Tìm kiếm nó thì dễ hơn. Sao chép nó cũng dễ hơn. Chia sẻ cũng dễ hơn. Xử lý dễ hơn. Những gì ta có thể làm là sử dụng lại thông tin này vào việc mà thậm chí chưa bao giờ tưởng tượng ra khi mới bắt đầu thu thập dữ liệu. Về lĩnh vực này, dữ liệu đã đi từ một kho tích trữ về một dòng chảy , từ thứ bất động và cố định sang linh hoạt và năng động. Có một thanh khoản thông tin. Cái đĩa được tìm thấy ở Crete đã 4000 năm tuổi, rất nặng, nó không lưu trữ được nhiều thông tin, và số thông tin đó không thể thay đổi. Ngược lại, tất cả những hồ sơ mà Edward Snowden lấy từ Cục An ninh Quốc gia Hoa Kỳ chứa vừa trong một thẻ nhớ bằng kích thước của móng tay, và có thể được chia sẻ với tốc độ ánh sáng. Nhiều dữ liệu hơn, hơn rất nhiều.

Now, one reason why we have so much data in the world today is we are collecting things that we've always collected information on, but another reason why is we're taking things that have always been informational but have never been rendered into a data format and we are putting it into data. Think, for example, the question of location. Take, for example, Martin Luther. If we wanted to know in the 1500s where Martin Luther was, we would have to follow him at all times, maybe with a feathery quill and an inkwell, and record it, but now think about what it looks like today. You know that somewhere, probably in a telecommunications carrier's database, there is a spreadsheet or at least a database entry that records your information of where you've been at all times. If you have a cell phone, and that cell phone has GPS, but even if it doesn't have GPS, it can record your information. In this respect, location has been datafied.

Một lý do tại sao có quá nhiều dữ liệu trên thế giới hiện nay là vì chúng ta đang thu thập những thứ ta vẫn luôn thu thập, một lý do khác để giải thích việc chúng ta lấy những thứ đã luôn cung cấp thông tin nhưng chưa bao giờ được làm thành dạng dữ liệu và do đó, chúng ta bỏ những thứ đấy vào dữ liệu Lấy ví dụ, câu hỏi về địa điểm Lấy ví dụ, Martin Luther Nếu chúng ta muốn biết vào năm 1500 Martin Luther ở đâu, chúng ta sẽ phải theo dõi ông ấy mọi lúc, kèm theo một cây bút lông và một lọ mực để ghi chép lại. Nhưng bây giờ hãy nghĩ nó sẽ như thế nào ngày nay. Bạn biết rằng ở một nơi nào đó, khả năng là trong cơ sở dữ liệu của một hãng viễn thông có một bảng tính hoặc ít nhất một mục cơ sở dữ liệu lưu trữ lại thông tin của bạn những nơi bạn đã đến tại mọi thời điểm Nếu bạn có điện thoại di động, và chiếc điện thoại đó có GPS, nhưng ngay cả khi nó không có GPS, nó vẫn có thể lưu trữ thông tin của bạn Trong lĩnh vực này, việc định vị đã được dữ liệu hóa

Now think, for example, of the issue of posture, the way that you are all sitting right now, the way that you sit, the way that you sit, the way that you sit. It's all different, and it's a function of your leg length and your back and the contours of your back, and if I were to put sensors, maybe 100 sensors into all of your chairs right now, I could create an index that's fairly unique to you, sort of like a fingerprint, but it's not your finger.

Bây giờ, lấy ví dụ vấn đề về tư thế tư thế mà các bạn đang ngồi bây giờ tư thế mà bạn ngồi, tư thế mà bạn ngồi, tư thế mà bạn ngồi Nó đều khác nhau, và đó là một chức năng giữa chiều dài chân bạn lưng bạn và những đường nét của lưng bạn và nếu bây giờ tôi đặt thiết bị cảm biến vào tất cả các ghế Tôi có thể tạo ra một chỉ số tương đối độc nhất về bạn, ví dụ như dấu vân tây, nhưng không phải là ngón tay của bạn

So what could we do with this? Researchers in Tokyo are using it as a potential anti-theft device in cars. The idea is that the carjacker sits behind the wheel, tries to stream off, but the car recognizes that a non-approved driver is behind the wheel, and maybe the engine just stops, unless you type in a password into the dashboard to say, "Hey, I have authorization to drive." Great.

Vậy chúng ta có thể làm gì với nó? Các nhà nghiên cứu ở Tokyo đang dùng dấu vân tay để tạo ra một thiết bị có tiềm năng chống trộm xe hơi. Ý tưởng là nếu tên trộm ngồi đằng sau tay lái và cố lái đi, nhưng nếu chiếc xe nhận ra rằng đằng sau bánh lái là một tài xế không được xác duyệt, thì động cơ sẽ tự động dừng, trừ khi bạn nhập mật khẩu vào bảng điều khiển để báo rằng "Tôi có sự cho phép". Tuyệt.

What if every single car in Europe had this technology in it? What could we do then? Maybe, if we aggregated the data, maybe we could identify telltale signs that best predict that a car accident is going to take place in the next five seconds. And then what we will have datafied is driver fatigue, and the service would be when the car senses that the person slumps into that position, automatically knows, hey, set an internal alarm that would vibrate the steering wheel, honk inside to say, "Hey, wake up, pay more attention to the road." These are the sorts of things we can do when we datafy more aspects of our lives.

Nếu như mọi chiếc xe ở Châu Âu đều có công nghệ này thì sao? Chúng ta có thể làm gì lúc đó? Nếu chúng ta có thể tập hợp dữ liệu có thể chúng ta sẽ khám phá ra các dấu hiệu dự đoán tốt nhất rằng một tai nạn xe hơi sẽ xảy ra trong 5 giây tiếp theo. Và rồi những gì chúng ta sẽ dữ liệu hóa sẽ là sự mệt mỏi của tài xế, và dịch vụ lúc đó sẽ là khi chiếc xe cảm nhận được rằng người tài xế đang rơi vào tình trạng mệt mỏi nó sẽ tự động biết và rồi cài một báo động bên trong để làm rung bánh lái, và bóp kèn ở trong xe báo rằng, "Này! dậy đi, chú ý đường đi kìa" Đây là những thứ mà chúng ta có thể làm khi chúng ta dữ liệu hóa các khía cạnh trong cuộc sống của chúng ta nhiều hơn

So what is the value of big data? Well, think about it. You have more information. You can do things that you couldn't do before. One of the most impressive areas where this concept is taking place is in the area of machine learning. Machine learning is a branch of artificial intelligence, which itself is a branch of computer science. The general idea is that instead of instructing a computer what do do, we are going to simply throw data at the problem and tell the computer to figure it out for itself. And it will help you understand it by seeing its origins. In the 1950s, a computer scientist at IBM named Arthur Samuel liked to play checkers, so he wrote a computer program so he could play against the computer. He played. He won. He played. He won. He played. He won, because the computer only knew what a legal move was. Arthur Samuel knew something else. Arthur Samuel knew strategy. So he wrote a small sub-program alongside it operating in the background, and all it did was score the probability that a given board configuration would likely lead to a winning board versus a losing board after every move. He plays the computer. He wins. He plays the computer. He wins. He plays the computer. He wins. And then Arthur Samuel leaves the computer to play itself. It plays itself. It collects more data. It collects more data. It increases the accuracy of its prediction. And then Arthur Samuel goes back to the computer and he plays it, and he loses, and he plays it, and he loses, and he plays it, and he loses, and Arthur Samuel has created a machine that surpasses his ability in a task that he taught it.

Vậy thì giá trị của dữ liệu lớn là gì? Nào, hãy nghĩ xem. Bạn có nhiều thông tin hơn. Bạn có thể làm những việc mà bạn không thể làm trước đó Một trong những lĩnh vực ấn tượng nhất mà khái niệm này đang diễn ra là trong lĩnh vực máy học. Máy học là một nhánh của trí tuệ nhân tạo mà bản thân nó là một nhánh của khoa học máy tính. Ý tưởng chung là thay vì phải hướng dẫn máy tính những gì phải làm chúng ta sẽ chỉ ném dữ liệu liên quan đến vấn đề và bảo máy tính tự tính toán. Và để giúp bạn hiểu vấn đề này hãy cùng nhìn lại nguồn gốc của nó. Vào những năm 1950, Một nhà khoa học máy tính của IBM tên Arthur Samuel thích chơi cờ, nên ông ấy viết một chương trình máy tính để ông ấy có thể chơi cờ với máy tính Ông ấy chơi. Ông ấy thắng. Ông ấy chơi. Ông ấy thắng, Ông ấy chơi. Ông ấy thắng, vì máy tính chỉ biết nước đi đúng luật là thế nào. Arthur Samuel biết một số thứ khác. Arthur Samuel biết chiến lược. Và như thế, bên cạnh đó, ông ấy viết một chương trình con. hoạt động trên nền của chương trình chính, và những gì nó làm chỉ là ghi xác suất của bàn cờ cho sẵn có khả năng dẫn đến một ván thắng hoặc một vấn thua sau mỗi nước đi. Ông ấy chơi với máy tính. Ông ấy thắng Ông ấy chơi với máy tính. Ông ấy thắng Ông ấy chơi với máy tính. Ông ấy thắng Và rồi Arthur Samuel để máy tính tự chơi cờ với chính nó. Nó tự chơi cờ. Nó thu thập nhiều dữ liệu hơn. Nó thu thập nhiều dữ liệu hơn. Nó tăng độ chính xác về khả năng dự đoạn Và rồi Arthur Samuel quay lại máy tính và ông ấy chơi cờ với nó, và ông ấy thua và ông ấy chơi, ông ấy thua và ông ấy chơi, ông ấy thua và Arthur Samuel đã tạo ra một cỗ máy vượt qua khả năng của ông ấy trong một việc mà chính ông ấy dạy nó.

And this idea of machine learning is going everywhere. How do you think we have self-driving cars? Are we any better off as a society enshrining all the rules of the road into software? No. Memory is cheaper. No. Algorithms are faster. No. Processors are better. No. All of those things matter, but that's not why. It's because we changed the nature of the problem. We changed the nature of the problem from one in which we tried to overtly and explicitly explain to the computer how to drive to one in which we say, "Here's a lot of data around the vehicle. You figure it out. You figure it out that that is a traffic light, that that traffic light is red and not green, that that means that you need to stop and not go forward."

Và ý tưởng này trong lĩnh vực máy học đang được ứng dụng ở mọi nơi. Bạn nghĩ làm sao chúng ta có xe hơi lái tự động? Xã hội chúng ta có khá hơn không khi chúng ta nhập tất cả các luật giao thông vào phần mềm? Không. Bộ nhớ rẻ hơn? Không Các thuật toán xử lý nhanh hơn? Không Bộ vi xử lý tốt hơn? Không Tất cả những điều này đều quan trọng, nhưng đó không phải là lý do. Mà là vì chúng ta đã thay đổi bản chất của vấn đề. Từ một vấn đề mà chúng ta tìm cách để giải thích rõ ràng và dứt khoát cho máy tính hiểu rằng làm thế nào để lái xe đến một vấn đề mà chúng ta nói rằng, "Đây là tập dữ liệu xung quanh chiếc xe. Hãy tự xử lý dữ liệu này. Hãy tự luận ra rằng đó là đèn giao thông, rằng đèn giao thông đó đang là đèn đỏ không phải đèn xanh rằng điều đó có nghĩa là bạn phải dừng lại và không đi về phía trước."

Machine learning is at the basis of many of the things that we do online: search engines, Amazon's personalization algorithm, computer translation, voice recognition systems. Researchers recently have looked at the question of biopsies, cancerous biopsies, and they've asked the computer to identify by looking at the data and survival rates to determine whether cells are actually cancerous or not, and sure enough, when you throw the data at it, through a machine-learning algorithm, the machine was able to identify the 12 telltale signs that best predict that this biopsy of the breast cancer cells are indeed cancerous. The problem: The medical literature only knew nine of them. Three of the traits were ones that people didn't need to look for, but that the machine spotted.

Máy học là nền tảng cơ bản của rất nhiều thứ chúng ta làm trên mạng: các công cụ tìm kiếm, Thuật toán cá nhân hóa của Amazon, máy tính dịch thuật, hệ thống xác nhận giọng nói. Gần đây, các nhà nghiên cứu đã tìm hiểu về các vấn đề sinh thiết sinh thiết ung thư, và họ đã nhờ máy tính xác định, bằng cách nhìn vào dữ liệu và chỉ số sống sót để xác nhận rằng những tế bào này có thật sự bị ung thư hay không, và chắc chắn rằng, khi bạn nhập dữ liệu vào máy tính, qua một thuật toán máy học cỗ máy có thể xác định những dấu hiệu dự đoán tốt nhất rằng sinh thiết của các tế bào ung thư vú này thật sự bị ung thư. Vấn đề: Tài liệu y học chỉ biết được 9 dấu hiệu. Trong đó, có 3 dấu hiệu mà mọi người không cần phải tìm kiếm nhưng cỗ máy phát hiện ra.

Now, there are dark sides to big data as well. It will improve our lives, but there are problems that we need to be conscious of, and the first one is the idea that we may be punished for predictions, that the police may use big data for their purposes, a little bit like "Minority Report." Now, it's a term called predictive policing, or algorithmic criminology, and the idea is that if we take a lot of data, for example where past crimes have been, we know where to send the patrols. That makes sense, but the problem, of course, is that it's not simply going to stop on location data, it's going to go down to the level of the individual. Why don't we use data about the person's high school transcript? Maybe we should use the fact that they're unemployed or not, their credit score, their web-surfing behavior, whether they're up late at night. Their Fitbit, when it's able to identify biochemistries, will show that they have aggressive thoughts. We may have algorithms that are likely to predict what we are about to do, and we may be held accountable before we've actually acted. Privacy was the central challenge in a small data era. In the big data age, the challenge will be safeguarding free will, moral choice, human volition, human agency.

Dữ liệu lớn cũng có mặt tối của nó. Nó sẽ cải thiện cuộc sống của chúng ta, nhưng có những vấn đề mà chúng ta nên cảnh giác, và điều đầu tiên đó là quan niệm rằng chúng ta có thể bị trừng phạt do các dự đoán, rằng cảnh sát có thể sử dụng dữ liệu lớn cho mục đích của họ, tựa như phim "Minority Report" Nó là một thuật ngữ gọi là giám sát dự báo hoặc thuật toán tội phạm học, và khái niệm đó là: nếu chúng ta lấy nhiều dữ liệu, ví dụ dữ liệu về các địa điểm xảy ra tội phạm chúng ta sẽ biết nơi cần gửi đội tuần tra. Điều đó là hợp lý, nhưng vấn đề, dĩ nhiên không phải chỉ dừng về ở dữ liệu định vị, nó sẽ xuống cấp độ thu thập dữ liệu của từng cá nhân Tại sao chúng ta không dùng dữ liệu để biết về bảng điểm cấp 3 của một người nào đó? Có thể chúng ta nên dùng sự thật như họ thất nghiệp hay không, điểm tín dụng, cách họ lướt web hay họ có thức khuya hay không. Chí số Fitbit, khi nó có khả năng xác định các hóa sinh, sẽ chỉ ra rằng họ có suy nghĩ hiếu chiến. Chúng ta có thể có những thuật toán có khả năng dự đoán những gì chúng ta sẽ làm, và chúng ta có phải chịu trách nhiệm trước khi chúng ta thật sự làm những điều đó Bảo mật là thách thức trọng tâm trong thời đại dữ liệu nhỏ. Trong thời đại dữ liệu lớn, thách thức sẽ là bảo vệ tự do, lựa chọn đạo đức, ý chí con người, tính chủ thể.

There is another problem: Big data is going to steal our jobs. Big data and algorithms are going to challenge white collar, professional knowledge work in the 21st century in the same way that factory automation and the assembly line challenged blue collar labor in the 20th century. Think about a lab technician who is looking through a microscope at a cancer biopsy and determining whether it's cancerous or not. The person went to university. The person buys property. He or she votes. He or she is a stakeholder in society. And that person's job, as well as an entire fleet of professionals like that person, is going to find that their jobs are radically changed or actually completely eliminated. Now, we like to think that technology creates jobs over a period of time after a short, temporary period of dislocation, and that is true for the frame of reference with which we all live, the Industrial Revolution, because that's precisely what happened. But we forget something in that analysis: There are some categories of jobs that simply get eliminated and never come back. The Industrial Revolution wasn't very good if you were a horse. So we're going to need to be careful and take big data and adjust it for our needs, our very human needs. We have to be the master of this technology, not its servant. We are just at the outset of the big data era, and honestly, we are not very good at handling all the data that we can now collect. It's not just a problem for the National Security Agency. Businesses collect lots of data, and they misuse it too, and we need to get better at this, and this will take time. It's a little bit like the challenge that was faced by primitive man and fire. This is a tool, but this is a tool that, unless we're careful, will burn us.

Còn có một vấn đề nữa: Dữ liệu lớn sẽ cướp đi việc làm của chúng ta. Dữ liệu lớn và các thuật toán sẽ thách thức công việc văn phòng, công việc chuyên môn trong thế kỷ 21 trong cùng một cách mà máy móc tự động và dây chuyền lắp ráp thách thức công nhân ở thế kỉ 20 Hãy nghĩ về kỹ thuật viên phòng thí nghiệm người tìm hiểu vấn đề qua một cái kính hiển vi ở viện sinh thiết ung thư và xác định xem sinh thiết này có bị ung thư hay không. Người này đã học xong đại học Người này mua nhà. Anh ấy hoặc cô ấy bỏ phiếu. Anh ấy hoặc cô ấy là một nhân tố trong xã hội. Và việc làm của người đó, cũng như toàn bộ đội ngũ của những người chuyên môn giống như người đó sẽ thấy rằng việc làm của họ bị thay đổi một cách triệt để hoặc bị loại bỏ hoàn toàn. Chúng ta thích nghĩ rằng công nghệ sẽ tạo nên việc làm sau một khoảng thời gian sau khoản thời gian rối loạn tạm thời, và điều đó là đúng cho các khung tham chiếu mà chúng ta sống, Cách mạng công nghiệp, vì đó chính xác là những gì đã xảy ra. Nhưng chúng ta quên điều gì đó trong bài phân tích đấy: Có một số loại công việc đơn giản là bị loại bỏ hoàn toàn và không bao giờ quay lại. Cách mạng công nghiệp không hề tốt nếu bạn là một con ngựa. Do đó chúng ta phải thận trọng trong việc sử dụng dữ liệu lớn và điều chỉnh nó cho nhu cầu của chúng ta nhu cầu rất con người của chúng ta. Chúng ta phải là chủ của công nghệ này, chứ không phải là người hầu của nó. Chúng ta chỉ khởi đầu một kỷ nguyên của dữ liệu lớn và thành thật mà nói, chúng ta không hề giỏi trong việc xử lý tất cả các dữ liệu mà chúng ta có thể thu thập. Nó không chỉ là vấn đề cho Cục An ninh Quốc gia. Các doanh nghiệp thu thập rất nhiều dữ liệu và họ cũng lạm dụng nó. Chúng ta phải làm tốt hơn và điều này sẽ tốn nhiều thời gian. Nó giống như là thử thách mà người nguyên thủy gặp phải với lửa Đây là một công cụ, nhưng là một công cụ mà nếu chúng ta không cẩn thận, sẽ thiêu cháy chúng ta.

Big data is going to transform how we live, how we work and how we think. It is going to help us manage our careers and lead lives of satisfaction and hope and happiness and health, but in the past, we've often looked at information technology and our eyes have only seen the T, the technology, the hardware, because that's what was physical. We now need to recast our gaze at the I, the information, which is less apparent, but in some ways a lot more important. Humanity can finally learn from the information that it can collect, as part of our timeless quest to understand the world and our place in it, and that's why big data is a big deal.

Dữ liệu lớn sẽ thay đổi cách sống của chúng ta cách chúng ta làm việc và cách chúng ta suy nghĩ. Nó sẽ giúp chúng ta quản lý sự nghiệp của chúng ta và dẫn đến cuộc sống của sự hài lòng và hy vọng và hạnh phúc và sức khỏe. Nhưng ở trong quá khứ, chúng ta thường nhìn vào công nghệ thông tin và con mắt chúng ta chỉ nhìn thấy những thứ như, công nghệ, phần mềm, những thứ vật chất. Chúng ta phải đúc kết lại cái nhìn của chúng ta, nhìn vào thông tin, dù nó ít rõ ràng hơn nhưng trong một số khía cạnh quan trọng hơn rất nhiều. Nhân loại cuối cùng cũng có thể học hỏi từ những thông tin mà nó có thể thu thập, như một phần của cuộc thám hiểm vô tận của chúng ta để hiểu về thế giới và vị trí của chúng ta trong thế giới, và đó là lý do tại sao dữ liệu lớn là một vấn đề quan trọng.

(Applause)

(vỗ tay)

America's favorite pie is?

Loại bánh ưa thích tại Mỹ là ?

(Applause)

(vỗ tay)

Kenneth Cukier: Big data is better data

Kenneth Cukier: Big data is better data

Related talks

David McCandless: The beauty of data visualization

Talithia Williams: Own your body's data

Tim Berners-Lee: The next web

Shyam Sankar: The rise of human-computer cooperation

Giorgia Lupi: How we can find ourselves in data

Anders Ynnerman: Visualizing the medical data explosion

Related talks

David McCandless: The beauty of data visualization

Talithia Williams: Own your body's data

Tim Berners-Lee: The next web

Shyam Sankar: The rise of human-computer cooperation

Giorgia Lupi: How we can find ourselves in data

Anders Ynnerman: Visualizing the medical data explosion