ما هي الفطيرة المفضلة عند الشعب الأمريكي؟
America's favorite pie is?
الجمهور: فطيرة التفاح. كينيث كوكير: فطيرة التفاح، بالطبع. كيف عرفنا ذلك؟ طبعاً بفضل البيانات. ألقوا نظرة على مبيعات مراكز التسوق الكبرى. انظروا الى مبيعات الفطائر المثلجة بحجم ٣٠ سنتيمتر تحتل فطيرة التفاح القمة بدون منازع. أغلبية المبيعات من منتجات التفاح. لكن فيما بعد، اتجهت هذه المراكز إلى بيع فطائر أصغر حجماً بحجم 11 سنتيمتر وفجأة تراجعت منتجات التفاح إلى المرتبة الرابعة أو الخامسة لماذا؟ ماذا حدث؟ حسنا، لنفكر في الأمر. عندما تشتري فطيرة بقياس 30 سنتمتر، يجب أن تجمع كل الأسرة على نفس الاختيار، والتفاح هو الخيار المفضل الثاني عند الجميع. (ضحك) لكن عندما تشتري فطائر بقياس 11 سنتمتر فردية، يمكنك شراء ما تفضله أنت. أي يمكنك أن تشتري اختيارك المفضل. بهذا تملك بيانات أكثر. بإمكانك رؤية أمور لم تكن تراها في السابق حين كان لديك كمية أقل من البيانات.
Audience: Apple. Kenneth Cukier: Apple. Of course it is. How do we know it? Because of data. You look at supermarket sales. You look at supermarket sales of 30-centimeter pies that are frozen, and apple wins, no contest. The majority of the sales are apple. But then supermarkets started selling smaller, 11-centimeter pies, and suddenly, apple fell to fourth or fifth place. Why? What happened? Okay, think about it. When you buy a 30-centimeter pie, the whole family has to agree, and apple is everyone's second favorite. (Laughter) But when you buy an individual 11-centimeter pie, you can buy the one that you want. You can get your first choice. You have more data. You can see something that you couldn't see when you only had smaller amounts of it.
المقصود بهذا هو أن كثرة البيانات لا تسمح لنا فقط برؤية أشياء أكثر عن ما نراه. بل أكثر من ذلك، فهي تعطينا رؤية جديدة. تعطينا رؤية أفضل. تعطينا منظوراً مختلفاً للأمور. و في هذه الحالة، تمكننا من معرفة نوع الفطائر المفضلة عند الأمريكيين: وهي ليست فطائر التفاح.
Now, the point here is that more data doesn't just let us see more, more of the same thing we were looking at. More data allows us to see new. It allows us to see better. It allows us to see different. In this case, it allows us to see what America's favorite pie is: not apple.
أظن أن الجميع هنا قد سمعوا بمصطلح "البيانات الضخمة" أظنكم قد سئمتم من سماع مصطلح "البيانات الضخمة" صحيح أنه أثار ضجة كبيرة كمصطلح، وهذا أمرٌ مؤسف، لأن البيانات الضخمة تعد أداةً مهمةً جداً لمساعدة المجتمع على التقدم. ففي السابق، اعتدنا على رؤية بياناتٍ محدودةٍ ومحاولة فهم معناها في سبيل فهم العالم من خلالها، أما الآن فلدينا فائض منها، أكثر من السابق بكثير. اكتشفنا أنه عند امتلاكنا بيانات ضخمة، يمكننا القيام بأمور لم يكن بإمكاننا القيام بها عندما كانت البيانات أقل. فالبيانات الضخمة مهمة وحديثة العهد، و عندما تفكر في هذا الأمر ستجد بأنها الوسيلة الوحيدة التي ستمكن كوكبنا من التعامل مع تحدياته العالمية. لتغذية الناس وإمدادهم بالعناية الطبية، و إمدادهم بالطاقة والكهرباء، و حمايتهم من الدمار الشامل بسبب الاحتباس الحراري. وهذا بفضل الاستخدام الفعال للبيانات.
Now, you probably all have heard the term big data. In fact, you're probably sick of hearing the term big data. It is true that there is a lot of hype around the term, and that is very unfortunate, because big data is an extremely important tool by which society is going to advance. In the past, we used to look at small data and think about what it would mean to try to understand the world, and now we have a lot more of it, more than we ever could before. What we find is that when we have a large body of data, we can fundamentally do things that we couldn't do when we only had smaller amounts. Big data is important, and big data is new, and when you think about it, the only way this planet is going to deal with its global challenges — to feed people, supply them with medical care, supply them with energy, electricity, and to make sure they're not burnt to a crisp because of global warming — is because of the effective use of data.
إذا ما الجديد في البيانات الضخمة؟ ما الأمر المهم؟ حسنا، للإجابة لهذا السؤال، دعونا نشاهد الشكل الذي اتخذته المعلومات، ظاهرياً في الماضي. في 1908 في جزيرة كريت اكتشف علماء الآثار قرص من طين. يعود تاريخه الى 2000 قبل الميلاد. يبلغ عمره 4000 سنة. توجد هناك نقوش على هذا القرص لكننا لا نعرف معناها بعد. الأمر يشوبه غموض تام، لكن المهم هو ان المعلومات كانت على هذا الشكل منذ 4000 سنة. هكذا كان يوثق المجتمع وينقل المعلومات.
So what is new about big data? What is the big deal? Well, to answer that question, let's think about what information looked like, physically looked like in the past. In 1908, on the island of Crete, archaeologists discovered a clay disc. They dated it from 2000 B.C., so it's 4,000 years old. Now, there's inscriptions on this disc, but we actually don't know what it means. It's a complete mystery, but the point is that this is what information used to look like 4,000 years ago. This is how society stored and transmitted information.
أما الآن، فلم تتقدم المجتمعات كثيراً فما زلنا نخزن المعلومات على الأقراص، لكن حالياً يمكننا أن نخزن كماً أكبر من المعلومات، أكثر من قبل. البحث والنسخ صارا أسهل. و كذلك المشاركة والمعالجة. باستطاعتنا إعادة استخدام هذه المعلومات لاستعمالات لم نكن نتخيلها عندما كنا نجمع المعلومات لأول مرة. في هذه الحالة، انتقلت البيانات من التخزين إلى تدفق للمعلومات، من شيءٍ جامدٍ وراكد، إلى آخر سلسٍ ومتحرك. بل و يمكننا أن نصف المعلومات بالسيولة. فالقرص الذي اكتُشف في كريت والذي يبلغ عمره 4000 سنة ثقيل، لا يمكنه تخزين كمٍّ كبيرٍ من المعلومات، و هذه المعلومات غير قابلة للتغيير. بالمقابل، فجميع الملفات التي أخذها إدوارد سنودن، من وكالة الأمن القومي في الولايات المتحدة يمكن تخزينها على ذاكرة محمولة، بحجم الإظفر. كما يمكن مشاركة هذه المعلومات بلمح البصر. الكثير والكثير من البيانات.
Now, society hasn't advanced all that much. We still store information on discs, but now we can store a lot more information, more than ever before. Searching it is easier. Copying it easier. Sharing it is easier. Processing it is easier. And what we can do is we can reuse this information for uses that we never even imagined when we first collected the data. In this respect, the data has gone from a stock to a flow, from something that is stationary and static to something that is fluid and dynamic. There is, if you will, a liquidity to information. The disc that was discovered off of Crete that's 4,000 years old, is heavy, it doesn't store a lot of information, and that information is unchangeable. By contrast, all of the files that Edward Snowden took from the National Security Agency in the United States fits on a memory stick the size of a fingernail, and it can be shared at the speed of light. More data. More.
أحد أسباب وجود هذا الكم من البيانات وهو أننا نخزن أموراً كنا دائماً نجمع معلومات عنها، وسبب آخر لهذا، أننا نأخذ أشياء كانت دوماً مليئة بالمعلومات ولكنها لم تحول إلى صيغة البيانات ومع ذلك نضعها مع البيانات. على سبيل المثال، مسألة المكان. مثلاً مارتن لوثر. لو أننا كنا في القرن السادس عشر وأردنا معرفة مكان مارتن لوثر كان علينا أن نتعقبه بشكل دائم و نحن نحمل قلم ودواة حبر ونسجل مكانه، أما اليوم انظروا كيف اختلفت الأمور تعلمون بأنه في مكان ما لعل في قاعدة بيانات شركة اتصالات يوجد هناك مدخل او جدول في قاعدة بيانات التي تسجل معلوماتك حول مكانك في كل وقت اذا كان لديك هاتف خلوي و كان مزودا بنظام تحديد المواقع او لا فيمكنه تسجيل معلوماتك اذن, فقد تم تسجيل معومات مكانك
Now, one reason why we have so much data in the world today is we are collecting things that we've always collected information on, but another reason why is we're taking things that have always been informational but have never been rendered into a data format and we are putting it into data. Think, for example, the question of location. Take, for example, Martin Luther. If we wanted to know in the 1500s where Martin Luther was, we would have to follow him at all times, maybe with a feathery quill and an inkwell, and record it, but now think about what it looks like today. You know that somewhere, probably in a telecommunications carrier's database, there is a spreadsheet or at least a database entry that records your information of where you've been at all times. If you have a cell phone, and that cell phone has GPS, but even if it doesn't have GPS, it can record your information.
و الآن فكر في وضعيتك وضعية جلوسك الآن كيفية جلوسك الطريفة التي تجلس فيها انت و انت كلها مختلفة بسبب طول قدمك و ظهرك و وضعية ظهرك لو وضعت مئة جهاز استشعار في كل الكراسي الآن لاستطعت رسم مخطط خاص بك و كأنه بصمتك , و لكن ليس بصمة اصبعك
In this respect, location has been datafied. Now think, for example, of the issue of posture, the way that you are all sitting right now, the way that you sit, the way that you sit, the way that you sit. It's all different, and it's a function of your leg length and your back and the contours of your back, and if I were to put sensors, maybe 100 sensors into all of your chairs right now, I could create an index that's fairly unique to you,
اذن ماذا استطيع ان افعل مع هذا؟ يستخدم الباحثون هذه الخاصية في طوكيو كجهاز كامن ضد السرقة في السيارات عندما يجلس السارق خلف المقود و يحاول الانطلاق, عندها تتعرف السيارة على ان الجالس لم يتم التعرف عليه و عندها ينطفئ المحرك الا اذا ادخلت الرقم السري في لوحة القيادة مثلا "مرحبا, لدي الصلاحية في القيادة"
sort of like a fingerprint, but it's not your finger. So what could we do with this? Researchers in Tokyo are using it as a potential anti-theft device in cars. The idea is that the carjacker sits behind the wheel, tries to stream off, but the car recognizes that a non-approved driver is behind the wheel, and maybe the engine just stops, unless you type in a password into the dashboard
ماذا لو كل سيارة في اروبا كانت تمتلك هذه التقنية؟ ماذا كنا نستطيع ان نفعله؟ لو اجمعنا البيانات لاستطعنا ان نتعرف على اشارات المؤشر و يعمل ايضا كافضل جهاز يتوقع حدوث اصطدام في الخمس ثوان المقبلة اذن, ستبين البيانات بأن السائق مرهق و ستفعل الخدمة عندما تستشعر السيارة بأن السائق يبدأ بالارهاق عندها ستفعل نظام الانذار الداخلي التي تبدأ بهز المقود و الصفير اشارة للسائق بأن يستيقظ و ان يراقب الطريق اكثر هذه الأمور التي باستطاعتنا فعله عندما نستجمع معلومات اكثر عن حياتنا
to say, "Hey, I have authorization to drive." Great. What if every single car in Europe had this technology in it? What could we do then? Maybe, if we aggregated the data, maybe we could identify telltale signs that best predict that a car accident is going to take place in the next five seconds. And then what we will have datafied is driver fatigue, and the service would be when the car senses that the person slumps into that position, automatically knows, hey, set an internal alarm that would vibrate the steering wheel, honk inside to say, "Hey, wake up, pay more attention to the road." These are the sorts of things we can do
اذن, ما هي فائدة هذا الكم من البيانات؟ حسنا, لننظر في الأمر لديك كم اكبر من المعلومات تستطيع فعل امور اكثر من ذي قبل من اكثر المجالات المذهلة التي تعمل فيها هذه الخاصية هو مجال التعلم الآلي التعلم الآلي هو فرع من الذكاء الاصطناعي و الذي في ذاته فرع من علوم الحاسبات بشكل عام تكون الفكرة انه بدل من امر الحاسوب بالعمل ببساطة سندخل معلومات حول المشكلة و نخبر الحاسبة بحل المشكلة بنفسها ستساعدك هذه العملية في فهم المشكلة في النظر في اصلها في الخمسينيات, كان هنالك عالم في الحاسبات في شركة (IBM) يعرف بـ آرثر سامويل كان يحب الشطرنج, فصنع برنامجا يستطيع فيها اللعب ضد الحاسبة لعب ففاز و لعب ففاز و لعب ففاز لأن الحاسبة كانت تعرف الخطوات القانونية في اللعبة ولكن سامويل كان يعرف امرا آخر كان يعرف الاستراتيجية فصنع برنامجا ثانويا مع اللعبة يعمل خلف الكواليس و كل ما كان يفعله هو حساب الاحتمالات انه اي لترتيب في اللعبة سيؤدي الى الفوز ضد الخصم بعد كل حركة في اللعبة لعب ضد الحاسبة ففاز و لعب ففاز و لعب ففاز بعدها ترك الحاسبة لتكون خصم نفسها في اللعبة لعبت ضد نفسها و استجمعت بيانات اكثر اكتسبت بيانات اكثر و زادت في دقة توقعاتها ثم رجع سامويل الى الحاسبة و لعب ضد الحاسبة فخسر و لعب فخسر و لعب فخسر عندها صنع سامويل آلة فاقت قدرته في المهمة التي علمها الى الحاسبة.
when we datafy more aspects of our lives. So what is the value of big data? Well, think about it. You have more information. You can do things that you couldn't do before. One of the most impressive areas where this concept is taking place is in the area of machine learning. Machine learning is a branch of artificial intelligence, which itself is a branch of computer science. The general idea is that instead of instructing a computer what do do, we are going to simply throw data at the problem and tell the computer to figure it out for itself. And it will help you understand it by seeing its origins. In the 1950s, a computer scientist at IBM named Arthur Samuel liked to play checkers, so he wrote a computer program so he could play against the computer. He played. He won. He played. He won. He played. He won, because the computer only knew what a legal move was. Arthur Samuel knew something else. Arthur Samuel knew strategy. So he wrote a small sub-program alongside it operating in the background, and all it did was score the probability that a given board configuration would likely lead to a winning board versus a losing board after every move. He plays the computer. He wins. He plays the computer. He wins. He plays the computer. He wins. And then Arthur Samuel leaves the computer to play itself. It plays itself. It collects more data. It collects more data. It increases the accuracy of its prediction. And then Arthur Samuel goes back to the computer and he plays it, and he loses, and he plays it, and he loses, and he plays it, and he loses, and Arthur Samuel has created a machine
و بدأت فكرة التعليم الآلي بالتوسع في كل مكان. اذن كيف حصلنا على سيارة ذات السياقة الآلية هل سنكون افضل كمجتمع واحد يعمل على ادخال المعلومات المرورية الى برنامج واحد؟ كلا. هل السبب في الخزن الرخيص؟ كلا. في سرعة الخوارزميات؟ سرعة المعالجات؟ كلا كلها مهمة الا انها ليست السبب. السبب هو اننا غيرنا طبيعة المشكلة. غيرنا طبيعة المشكلة الى صورة نعمل فيها بجهد على تعليم الحاسبة كيفية السياقة في برنامج نقول له: "هذه معلومات حول السيارة" انت اكتشف الأمر لوحدك انت اكتشف اين اشارة المرور. و ان الاشارة حمراء و ليست خضراء و التي تعني التوقف و ليس الحركة.
that surpasses his ability in a task that he taught it. And this idea of machine learning is going everywhere. How do you think we have self-driving cars? Are we any better off as a society enshrining all the rules of the road into software? No. Memory is cheaper. No. Algorithms are faster. No. Processors are better. No. All of those things matter, but that's not why. It's because we changed the nature of the problem. We changed the nature of the problem from one in which we tried to overtly and explicitly explain to the computer how to drive to one in which we say, "Here's a lot of data around the vehicle. You figure it out. You figure it out that that is a traffic light, that that traffic light is red and not green, that that means that you need to stop
التعليم الآلي هو الأساس لكثير من الأمور التي نفعلها على النت مثل محركات البحث و الخوارزميات المخصصة لموقع آمازون و ترجمة الحاسبة و انظمة التعرف الصوتي. بدأ الباحثون مؤخرا في دراسة التحليلات النسيجية و التحليلات السرطانية و طلبوا من الحاسبة التعرف على النتائج من خلال حساب البيانات و احتمالية الشفاء لتحديد ان كانت فعلا الخلايا سرطانية ام لا. و بالتأكيد عند ادخال البيانات عن طريق خوارزميات في التعليم الآلي استطاعت الحاسبة في التعرف على اثني عشر مؤشرا من التحليل ان هذه الخلايا هي بالفعل خلايا سرطانية. كانت المشكلة ان المعلومات الطبية المتوفرة قد تعرفت على تسعة مؤشرات فقط كانت هناك ثلاث مؤشرات لم يبحثها الأطباء بينما اكتشفتها الحاسبة.
and not go forward." Machine learning is at the basis of many of the things that we do online: search engines, Amazon's personalization algorithm, computer translation, voice recognition systems. Researchers recently have looked at the question of biopsies, cancerous biopsies, and they've asked the computer to identify by looking at the data and survival rates to determine whether cells are actually cancerous or not, and sure enough, when you throw the data at it, through a machine-learning algorithm, the machine was able to identify the 12 telltale signs that best predict that this biopsy of the breast cancer cells are indeed cancerous. The problem: The medical literature only knew nine of them. Three of the traits were ones that people didn't need to look for,
بالمقابل, هنالك جانب مظلم للبيانات الكبيرة سوف تحسن طريقة حياتنا, لكن توجد هناك مشكلة يجب الحذر منها. اولها اننا قد نُعاقب لهذه التنبؤات لأن الشرطة قد تستخدم هذه الخاصية في عملها كما في فلم "تقرير الأقلية". يوجد الآن مصطلح يعرف بـ "الأمن التنبؤي" او "خوارزميات علم الجريمة" و الفكرة هي عندما نأخذ مجموعة من البيانات مثلا مكان وقوع الجريمة سوف نعرف اين نرسل الدوريات هذا أمر منطقي, لكن المشكلة هي ان النظام لن يتوقف عند معلومات الموقع و انما يبدأ بالبحث في معلومات الأفراد مثلا المعلومات الشخصية عن الشخص في ايام دراسته في الثانوية لعنا يجب دراسة وضع الشخص ان كان موظفا ام لا, و درجته الائتمانية و طريقة استخدامه للانترنت هل الشخص يبقى مستيقظا لوقت متأخر و معلومات نظامه الصحي و العقلي عندها سيتبين ان الفرد لديه افكار عدوانية. قد تكون لدينا خوارزميات تتنبأ حول ما سنفعله بعد قليل و دراسة النتائج قبل الاقدام على الفعل. كان الخصوصية من اهم التحديات في مجال البيانات المحدودة. اما في عصر البيانات المفتوحة سوف يكون التحدي هو حماية الحرية الفردية و القرارات الفردية و قوة الارادة و الكيان الفردي.
but that the machine spotted. Now, there are dark sides to big data as well. It will improve our lives, but there are problems that we need to be conscious of, and the first one is the idea that we may be punished for predictions, that the police may use big data for their purposes, a little bit like "Minority Report." Now, it's a term called predictive policing, or algorithmic criminology, and the idea is that if we take a lot of data, for example where past crimes have been, we know where to send the patrols. That makes sense, but the problem, of course, is that it's not simply going to stop on location data, it's going to go down to the level of the individual. Why don't we use data about the person's high school transcript? Maybe we should use the fact that they're unemployed or not, their credit score, their web-surfing behavior, whether they're up late at night. Their Fitbit, when it's able to identify biochemistries, will show that they have aggressive thoughts. We may have algorithms that are likely to predict what we are about to do, and we may be held accountable before we've actually acted. Privacy was the central challenge in a small data era. In the big data age, the challenge will be safeguarding free will, moral choice, human volition, human agency.
توجد هناك مشكلة اخرى. سوف تقوم هذه البيانات الضخمة بسرقة وظائفنا هذه البيانات الى جنب الخوارزميات سوف تقوم بتحدي اعمالنا الاحترافية في القرن الواحد و العشرين بنفس الطريقة التي قامت المصانع و الآليات بتحدي عمال الفحم في القرن العشرين. مثلا عامل فني في مختبر الذي يقوم بالدراسة من خلال النظر عبر المجهر في التحليلات و القرار ان كانت الخلايا سرطانية ام لا. في الواقع قد ذهب هذا الشخص الى الجامعة و قد يمتلك بيتا و يصوت في الانتخابات و قد يكون من اصحاب المصالح في المجتمع فيصبح عمل هذا الشخص و كثيرين من امثاله من المحترفين سوف يجدون ان اعمالهم قد تغيرت كليا او انتهت تماما. و الآن علينا ان نفكر بأن التكنولوجيا سوف تصنع وظائف جديدة خلال فترة زمنية قليلة و التي سوف تمسنا و بعبارة اخرى انها ثورة صناعية اخرى و هذا بالفعل ما حدث. و لكننا نسينا شيئا في هذا التحليل. توجد هناك عدة اصناف من الوظائف التي سوف تنتهي و لن تعود ابدا. لم تكن الثورة الصناعية مثالية في واقعها بانسبة للخيول مثلا. اذن علينا ان نكون اكثر حذرا و علينا ان نستفيد من البيانات بصورة تكمل الحاجات الانسانية علينا ان نكون اسياد هذا التطور و ليس عبيده. نقف الآن على اعتاب هذا العصر المعلوماتي و بصراحة لسنا بارعين في هذا المجال في تصنيف المعلومات التي نحصل عليها. ليت عائقا فقط لوكالة الأمن القومي. يتم جمع كم هائل من البيانات و لكن لا تُستخدم بصورة صحيحة علينا ان نطور انفسنا في هذا المجال و هذا يستغرق وقتا يشبه هذا التحدي نفس التحدي الذي واجهه الانسان البدائي مع النار. انها اداة, و لكننا ان استخدمناه بصورة خاطئة سوف تحرقنا.
There is another problem: Big data is going to steal our jobs. Big data and algorithms are going to challenge white collar, professional knowledge work in the 21st century in the same way that factory automation and the assembly line challenged blue collar labor in the 20th century. Think about a lab technician who is looking through a microscope at a cancer biopsy and determining whether it's cancerous or not. The person went to university. The person buys property. He or she votes. He or she is a stakeholder in society. And that person's job, as well as an entire fleet of professionals like that person, is going to find that their jobs are radically changed or actually completely eliminated. Now, we like to think that technology creates jobs over a period of time after a short, temporary period of dislocation, and that is true for the frame of reference with which we all live, the Industrial Revolution, because that's precisely what happened. But we forget something in that analysis: There are some categories of jobs that simply get eliminated and never come back. The Industrial Revolution wasn't very good if you were a horse. So we're going to need to be careful and take big data and adjust it for our needs, our very human needs. We have to be the master of this technology, not its servant. We are just at the outset of the big data era, and honestly, we are not very good at handling all the data that we can now collect. It's not just a problem for the National Security Agency. Businesses collect lots of data, and they misuse it too, and we need to get better at this, and this will take time. It's a little bit like the challenge that was faced by primitive man and fire. This is a tool, but this is a tool that, unless we're careful, will burn us.
هذه البيانات سوف تغير طريقة معيشتنا و عملنا و طريقة تفكيرنا. سوف تساعدنا في ادارة وظائفنا لنصنع حياة الرضا و الأمل و السعادة و الصحة سابقا كنا ننظر الى تكنولوجيا المعلومات و لم نكن نرى فيها روحا مجرد ادوات و هذا كان الواقع الملموس. اما الآن يجب ان نعيد النظر لنرى الروح و ليس فقط الجسد الذي هو اقل وضوحا و لكن باتأكيد اكثر اهمية. استطاع البشر اخيرا ان يتعلم من المعلومات التي يستجمعها جزءا من التساؤل الأزلي حول مفهوم الحياة و الوجود و لهذا البيانات الكبيرة هي ذات اهمية كبيرة
Big data is going to transform how we live, how we work and how we think. It is going to help us manage our careers and lead lives of satisfaction and hope and happiness and health, but in the past, we've often looked at information technology and our eyes have only seen the T, the technology, the hardware, because that's what was physical. We now need to recast our gaze at the I, the information, which is less apparent, but in some ways a lot more important. Humanity can finally learn from the information that it can collect, as part of our timeless quest to understand the world and our place in it, and that's why big data is a big deal.
(تصفيق)
(Applause)