الكل يكذب
-بقلم : سيث ستيفنز دافيدويتز
Everybody Lies (2017) هو كتاب عن الكميات الهائلة من البيانات التي حصلت عليها أجهزة الكمبيوتر والإنترنت. نظرًا لأن الأشخاص ليسوا دائمًا على استعداد لمشاركة تطلعاتهم وأهدافهم الحقيقية مع الآخرين ، يمكن أن تساعد هذه البيانات في الكشف عن حقائق مثيرة للاهتمام حول علم النفس والسلوك والخصائص البشرية.
هناك علم بيانات أكثر سهولة مما تعتقد.
البيانات الضخمة هي كلمة صادفتها بالتأكيد من قبل ، فما هي بالضبط؟
الاسم يعطي اللعبة بعيدا. يشير مصطلح “البيانات الضخمة” إلى كمية هائلة من البيانات. كمية هائلة لدرجة أن الخيال البشري يكافح من أجل استيعابها. بعبارة أخرى ، البيانات الضخمة هي البيانات التي تتطلب الكثير من موارد الحوسبة للتعرف على الأنماط. من المثير للدهشة ، على الرغم من نطاقه الهائل ، أن علم البيانات له جودة شبيهة بالإنسان. بعد كل شيء ، نحن جميعًا علماء بيانات بطريقة أو بأخرى.
يقدم المؤلف اقتراحًا تجاه جدته. بدأت تشرح للمؤلف كيف يجب أن تبدو زوجة أحلامه في عيد الشكر – على الأقل فيما يتعلق بها! يجب أن يكون الرفيق ذكيًا ولطيفًا ومضحكًا ومؤنسًا وجذابًا (على الرغم من عدم الحاجة إلى عارضات الأزياء للتقدم).
شهدت جدته ، البالغة من العمر 88 عامًا ، الكثير من الزيجات التي تأتي وتذهب. كانت توضح الصفات التي اعتبرتها مهمة في الشراكات الجيدة بناءً على سنوات من البحث وجمع البيانات. كانت تستخدم البيانات لتحديد الاتجاهات والتنبؤ بكيفية تواصل المتغيرات المختلفة ، تمامًا كما يفعل عالم البيانات.

ومع ذلك ، في حين أن علم البيانات هو ممارسة بديهية ، فإن الحدس ليس علمًا في حد ذاته. نتيجة لذلك ، يعد الاستخدام الفعال للبيانات التي تم جمعها أمرًا بالغ الأهمية لتحسين رؤية الفرد للعالم. تعطينا البيانات التفاصيل التي نحتاجها لتأكيد أو تناقض غرائزنا الغريزية. إنه يمكّن المرء من اكتشاف اتجاهات وتوقعات أكثر دقة من المعرفة الشخصية وحدها.
بالعودة إلى الجدة ، اعتقدت أنه إذا كان لدى العشاق رفقاء مشتركون ، فإن زيجاتهم ستستمر لفترة أطول. كان هذا بناءً على تجربتها الخاصة ، حيث قضت هي وزوجها عدة أمسيات في كوينز ، نيويورك ، مع أسرهم.
ومع ذلك ، كان حجم عيّنتها صغيرًا جدًا ، وتشير الأدلة القاطعة إلى أنها كانت غير صحيحة. وجد لارس باكستروم وجون كلاينبيرج أن الأزواج الذين يشاركون المزيد من الأصدقاء كانوا أكثر عرضة لتغيير حالة علاقتهم من “في علاقة” إلى “أعزب” في تحليل عام 2014 بناءً على نتائج الفيسبوك.
يوضح هذا أنه في حين أن الحدس يمكن أن يقطعنا شوطا طويلا ، يمكن للأدلة أن تنقح حتى وجهة نظر الشخص الأكثر ثاقبة.
تتيح لنا البيانات الضخمة أيضًا فهم مجموعات فرعية صغيرة من البيانات.
من المستحيل فهم أهمية البيانات الضخمة. كل يوم ، تعالج جوجول وحدها كميات هائلة من البيانات ، ناهيك عن محركات البحث والمواقع الأخرى بشكل عام. يمكننا الآن القيام بشيء لم نتمكن من القيام به من قبل بسبب الكم الهائل من المعلومات.
يسمح حجم مجموعات البيانات للفرد بتكبير مجموعة فرعية وجمع المعلومات منها بدقة ، وهي ثالث فائدة رئيسية للبيانات الضخمة.
ضع في اعتبارك السيناريو التالي. أراد راج شيتي ، الأستاذ بجامعة هارفارد ، معرفة ما إذا كان الأفراد ما زالوا يؤمنون بالحلم الأمريكي. اختار استخدام البيانات الضخمة للمساعدة في بناء إجابة لسؤال أكثر تحديدًا: هل يمكن لأطفال الآباء الفقراء أن يكبروا ليصبحوا أثرياء؟
أصدرت دائرة الإيرادات الداخلية الأمريكية سجلات ضريبية لموظفي شيتي. لديهم أكثر من مليار نتيجة ضريبية في المجموع.
كانت المعلومات جديرة بالاهتمام. وكشفت أنه على عكس الدول المتقدمة الأخرى مثل الدنمارك وكندا ، فإن حالة الفقراء في الولايات المتحدة لم تكن مثالية. كان لدى الأمريكية المحرومة احتمال 7.5 في المائة للنجاح في المهنة التي اختارتها. ومع ذلك ، كانت الفرص 11.7٪ و 13.5٪ للدنماركيين والكنديين على التوالي.
كانت هذه هي الصورة الكبيرة ، ولكن بفضل البيانات الضخمة ، كان شيتي قادرًا على التكبير في مختلف الولايات والمدن والبلدات والمجتمعات.
عندما فعل ذلك ، اكتشف أن البيانات أظهرت أن الحلم الأمريكي كان موجودًا ، ولكن في مواقع قليلة فقط. كان أميركيًا فقيرًا في سان خوسيه بكاليفورنيا معرضًا لخطر أن يصبح ثريًا بنسبة 12.9 في المائة ، وهي نسبة أعلى من الدنمارك. ومع ذلك ، كانت الاحتمالات 4.4 في المائة فقط لأمريكي نشأ في شارلوت بولاية نورث كارولينا.
تُظهر هذه القدرة على التكبير كيف يمكن للبيانات الضخمة أن تزودنا برؤية معقدة للكرة الأرضية ، بغض النظر عن المكان الذي ننظر فيه أو الحجم الذي نستخدمه.
البيانات الضخمة ليست رائعة مع وجود الكثير من المتغيرات أو المخاوف التي لا يمكن قياسها.
تتمتع البيانات الضخمة بالكثير من الفوائد ، لكنها لا تخلو من العيوب. في مجموعات البيانات ذات المتغيرات المتعددة ، يصبح الخلل الأكبر واضحًا: من المستحيل الحصول على إجابات دقيقة لأن عدد المتغيرات يحجب النتائج المستقبلية.
خذ بعين الاعتبار أطروحة روبرت بلومين ، عالم الوراثة السلوكية. وادعى أنه اكتشف جينًا ، IGF2r ، كان ينبئ بمعدل الذكاء لدى الناس في عام 1998. كما جمع مجموعة بيانات تحتوي على معلومات حول مستويات الحمض النووي ومعدل الذكاء والتي تم جمعها من مئات الطلاب. قارن بلومين الحمض النووي الخاص بهم مع الطلاب ذوي معدلات الذكاء المرتفعة والمنخفضة واكتشف أن IGF2r كان أكثر عرضة مرتين للملاحظة في الطلاب ذوي معدلات الذكاء المرتفعة.
لسوء الحظ ، كان التشابه مجرد صدفة. عندما قارن بلومين مجموعات البيانات مرة أخرى قبل بضع سنوات ، لم يكن هناك ارتباط بين معدل الذكاء ووجود IGF2r.
من السهل شرح السبب. هناك الآلاف من الجينات في الجينوم البشري ، لذا فإن أي أوجه تشابه موجودة لا يزال من الممكن أن تكون مصادفة. نظرًا لوجود العديد من العوامل ، ستظهر الاتجاهات في أي وقت.
هناك شيء آخر يتعلق بالبيانات الضخمة. غالبًا ما يفتقر إلى ما يسمى البيانات الصغيرة أو المعلومات حول حياة الناس. يمكن للبيانات الضخمة أن تحسب الكثير ، لكن النتائج الملموسة ليست حقًا ما نبحث عنه في بعض الأحيان.
فيسبوك ، على سبيل المثال ، سيتتبع النقرات والتفضيلات بدقة بفضل البيانات الضخمة. ومع ذلك ، فإن القيام بذلك لن يكشف أي شيء عن تجارب المستخدمين مع الموقع للشركة.
البيانات الصغيرة مهمة في مثل هذه الحالات. يجمع فيسبوك هذه المعلومات بطرق أخرى ، مثل استطلاعات الرأي على نطاق صغير والتي يتم من خلالها سؤال الأشخاص عن آرائهم وتفاعلاتهم على الويب. يستعين فيسبوك أيضًا بالباحثين وعلماء الاجتماع لمساعدتهم على فهم تفاعلات المستخدم غير القابلة للقياس الكمي.
يوضح هذا فقط أن البيانات الضخمة ليست خالية من العيوب ، وأن المشكلات أكثر خطورة.
لا ينبغي للحكومات استخدام البيانات الضخمة لاستهداف الأفراد.
في أي وقت تستخدم فيه جوجول للبحث عن شيء ما أو التصفح بحثًا عن شيء ما عبر الإنترنت ، فأنت تساهم في البيانات الضخمة – فماذا عن الآثار الأخلاقية؟ ماذا سيحدث إذا تمكنت الحكومة من الوصول إلى هذه المعلومات؟ ماذا يمكن أن يفعلوا به؟
افترض أن أحدهم كتب في محرك بحث ، “أريد أن أقتل نفسي”. هل من الضروري إخطار الشرطة المحلية؟
من الواضح أن السلطات لا تعمل ولا يمكنها العمل على أساس فردي في مثل هذه الظروف ، ولسبب وجيه. في الولايات المتحدة ، هناك 3.5 مليون عملية بحث على جوجول متعلقة بالانتحار كل شهر. وبالمقارنة ، فإن معدل الانتحار في البلاد أقل من 4000 في الشهر. إذا أرادت الشرطة تعقب الشخص المعني في أي وقت يتم فيه كتابة فكرة انتحارية على جهاز كمبيوتر ، فسيكون ذلك بمثابة إهدار كبير للمال.
لكن لا يزال هناك عنصر أخلاقي يجب مراعاته. هل يجب أن تكون الحكومات قادرة على جمع واستغلال بيانات البحث عن الأفراد؟ بعد كل شيء ، سيكون هذا انتهاكًا لخصوصية الفرد.
لم تمنع هذه المخاوف الأخلاقية صانعي السياسات من استخدام البيانات الضخمة على المستوى الإقليمي ، لا سيما عندما تشير المزيد من الأبحاث إلى وجود صلة بين عمليات البحث عبر الإنترنت والإجراءات اللاحقة.
على سبيل المثال ، ترتبط عمليات البحث المتعلقة بالانتحار على جوجول ارتباطًا وثيقًا بمعدلات الانتحار الحقيقية ، وفقًا للباحثين كريستين ما كيلامز وفلورا أور وجيهيون بيك وإيشيرو كاواتشي في تقرير عام 2016. ومع ذلك ، كان الاتصال صالحًا فقط على مستوى الدولة.
إذن ، كيف ستستفيد حكومات الولايات والحكومات المحلية وقوات الشرطة من هذه المعلومات؟ يمكنهم استخدامه في جهود منع الانتحار المحلية الفريدة ، كما هو الحال على مستوى الولاية أو المستوى الإقليمي. قد يستخدمون الإعلانات الإذاعية والتلفزيونية لنشر المعلومات ، بما في ذلك النصائح حول المكان الذي يجب أن يتوجهوا إليه ومن يتصلون به إذا احتاج أي شخص إلى المساعدة.
ويوضح أيضًا أنه بالإضافة إلى كشف جميع أنواع الحقائق الرائعة عن الأشخاص ، يمكن أيضًا استخدام البيانات الضخمة في سياقات الحياة الواقعية.
الملخص النهائي
نادرا ما يجيب الناس على الاستطلاعات بصراحة ، مما يؤدي إلى انحراف وجهات نظرنا عن العالم. ومع ذلك ، نظرًا لظهور البيانات الضخمة – تجميع كميات هائلة من البيانات من مواقع مثل عمليات بحث جوجول – يمكننا الآن اكتشاف اتجاهات السلوك البشري والتعرف على التفضيلات التي لم نكن نعلم بوجودها من قبل.
إذا كانت لديك تخيلات جنسية غريبة ، فلا تخف.
أنت لست الوحيد الذي يشعر بهذه الطريقة! على الرغم من أنك لن تجعل أي شخص يعترف بأوثانهم ، فمن المحتمل أن بعض الناس يخافون من التعرض للرفض الاجتماعي إذا فعلوا ذلك.
لذا ، إذا كنت شجاعًا ، فعبّر عن رغباتك الحقيقية! ستحصل بالتأكيد على بعض التحديق الغريب ، لكن البيانات الضخمة تُظهر أنه يوجد دائمًا شخص ما مثلك تمامًا. بدلاً من إخفائها ، اجعل كل الأشياء الغريبة والغريبة التي تكتبها عادةً في جوجول موضوعًا للنقاش. ربما ستبدأ بعد ذلك في تطبيع بعض جوانب الطبيعة البشرية التي لم تُقال.