كتاب لماذا

The Book of Why
by Judea Pearl, Dana MacKenzie

كتاب لماذا
بواسطة يهودا بيرل، دانا ماكنزي
في العلوم
العلم الجديد للسبب والنتيجة. كبشر، غريزتنا هي طرح الأسئلة “لماذا” و “ماذا لو؟” كما تذهب عن يومك، قد تسأل نفسك، “إذا كنت تأخذ هذا الأسبرين، وسوف الصداع بلدي يذهب بعيدا؟” أو “ماذا أكلت التي جعلت معدتي يصب؟” قد تسأل حتى أسئلة عن الماضي أيضا مثل، “ماذا لو غادرت بيتي قبل بضع دقائق فقط، وأود أن جعلت رحلتي؟” كلما طرحنا أسئلة مثل هذه، فإننا نتعامل مع علاقات السبب والنتيجة، أو كيف تؤدي عوامل معينة إلى نتائج مختلفة. في المجتمع العلمي، كان شعار “الارتباط ليس السببية” هو الشعار الذي ردده العلماء لأكثر من قرن من الزمان، ويحظر الحديث السببي في العديد من الفصول الدراسية والدراسات العلمية. ولكن اليوم مررنا بثورة سببية بتحريض من المؤلفة يهودا بيرل وزملاؤه. من خلال كتاب لماذا، بيرل يبين لنا كيف عمله في العلاقات السببية سوف تسمح لنا لاستكشاف العالم في أكثر من طريقة واحدة. كما يظهر لنا أن مفتاح الذكاء الاصطناعي هو الفكر البشري وإنشاء الآلات التي يمكن أن تحدد الأسباب والآثار. كما تقرأ، سوف تتعلم كيف الدماغ البشري هو الأداة الأكثر تقدما في العالم، وكيف يساء فهم البيانات يمكن أن يؤدي إلى احتجاجات على لقاح الجدري، وكيف أن التجارب التي تسيطر عليها كانت موجودة منذ فترة طويلة مثل البشر.

مقدمة
سؤال واحد بسيط طرح قبل عشرات الآلاف من السنين، سمح للبشر القدرة على اكتشاف أفكار جديدة وخلق ابتكارات رائعة. ونتيجة للإجابة على هذا السؤال، أنشأ البشر مجتمعات منظمة وبلدات ومدن، وفي نهاية المطاف الحضارة القائمة على العلم والتكنولوجيا التي نعيش فيها اليوم. كل هذا جاء لأن البشر سألوا سؤالا بسيطا: لماذا؟ كما ترى، البشر قادرون على إدراك أن بعض الأشياء تسبب أشياء معينة أخرى وأن ترقيع واحد يمكن أن يغير الآخر. لا يمكن لأنواع أخرى أن تفهم هذا، ليس مثل البشر. هذا العلم الجديد هو ما تشير إليه يهودا بيرل ودانا ماكنزي باسم “الاستدلال السببي”، ويفترض أن الدماغ البشري هو الأداة الأكثر تقدما على الإطلاق المصممة لإدارة الأسباب والآثار. يمكن لأدمغتنا تخزين كمية هائلة من المعرفة السببية ، مما يعطينا القدرة على إطلاق العنان لهذه المعرفة والإجابة على بعض الأسئلة الأكثر إلحاحا في كل العصور. أسئلة مثل: “ما مدى فعالية علاج معين في الوقاية من الأمراض؟ هل تسبب قانون الضرائب الجديد في ارتفاع مبيعاتنا، أم كانت حملتنا الإعلانية؟ ما هي تكلفة الرعاية الصحية التي تعزى إلى السمنة؟ هل يمكن لسجلات التوظيف أن تثبت أن صاحب العمل مذنب بسياسة التمييز على أساس الجنس؟ وحتى أنا على وشك ترك عملي هل يجب علي ذلك؟” هذه الأسئلة، على الرغم من اختلافها، كلها تتعلق بعلاقات السبب والنتيجة. واليوم، لا يسمح لنا العلم بطرح هذه الأسئلة فحسب، بل بالإجابة عليها أيضا. وقد خلق هذا العلم الجديد لغة رياضية بسيطة التي يمكن استخدامها الآن للجمع بين معرفتنا مع البيانات والإجابة على الأسئلة السببية مثل تلك المذكورة أعلاه.
يأمل المؤلفان يهودا بيرل ودانا ماكنزي أن يساعدنا العلم الجديد للاستدلال السببي على فهم أفضل لكيفية فهم البشر لعلاقات السبب والنتيجة بشكل أفضل من أجهزة الكمبيوتر والبيانات. وعلاوة على ذلك ، “في عصر أجهزة الكمبيوتر ، وهذا الفهم الجديد يمكن أن تجلب أيضا احتمال تضخيم قدراتنا الفطرية حتى نتمكن من فهم أفضل للبيانات ، سواء الكبيرة والصغيرة”.
الفصل 1: بداية الثورة السببية
على مدى العقود القليلة الماضية، كانت عبارة “الارتباط لا يعني السببية” شعارا ردده العلماء. لقد تم قبوله إلى حد كبير ، ويرجع ذلك جزئيا إلى عمل وبحث كارل بيرسون ، عالم الرياضيات الإنجليزي في القرن العشرين الذي عمل بحماس لإثبات أن السببية لم تكن أكثر من حالة خاصة من الارتباط. ببساطة، يعتقد بيرسون أن البيانات هي كل ما في العلم. لا شيء آخر. وأعرب عن اعتقاده بأن هذا صحيح لأنه لا يمكن إثبات السببية أو تمثيلها بالبيانات. لذلك السببية غير مقبولة علميا.
ينتمي بيرسون إلى مدرسة فلسفية تسمى الوضعية، والتي كانت تعتقد أن الكون هو نتاج الفكر البشري وأن العلم ليس سوى وصف لتلك الأفكار. لذلك ، السببية هي عملية موضوعية تحدث خارج الدماغ البشري ، وبالتالي لا يمكن أن يكون لها معنى علمي. على استعداد لتجاهل السببية تماما ، بيرسون كذلك ثبت وجهة نظره من خلال تحديد الارتباطات التي يعتقد أنها كاذبة أو وهمية. على سبيل المثال، أحد هذه الارتباطات هو العلاقة بين استهلاك الفرد من الشوكولاتة في الدولة وعدد الفائزين بجائزة نوبل. هذا الارتباط يبدو سخيفا لأننا لا نستطيع فهم فكرة أن تناول الشوكولاته يمكن أن يسبب جائزة نوبل!
ولكن ما فشل بيرسون في الإشارة إليه هو أن المزيد من الناس في البلدان الغربية الغنية يأكلون الشوكولاتة، والفائزون بجائزة نوبل هم عادة من تلك البلدان. الشيء الهموني هو أن هذا هو التفسير السببي ، والتي ، بالنسبة لبيرسون ، ليست ضرورية للتفكير العلمي. وعلاوة على ذلك، أثبت عالم الوراثة سيوال رايت في وقت لاحق أن السببية يمكن تمثيلها رياضيا، وهو ما اكتشفه أثناء بحثه في جامعة هارفارد. أثناء دراسة المعاطف والعلامات على خنازير غينيا، سعى رايت إلى تحديد مدى الوراثة التي كانت علاماتها.
بدأ رايت يشك في أن علم الوراثة وحده يحدد كمية اللون الأبيض وأشار إلى أن عوامل النمو في الرحم تسبب علامات واختلافات مختلفة. لذلك، قام بتقدير العوامل التنموية من خلال إنشاء صيغة رياضية. في حالة رايت ، يتم تمثيل الكمية المطلوبة وغير المعروفة من قبل د ، وهو تأثير “عوامل النمو” على الفراء الأبيض. وشملت الكميات الأخرى المدرجة في المعادلة ح، لعوامل “وراثية”، وهي أيضا غير معروفة. وأخيرا، أظهر رايت أنه إذا كنا نعرف الكميات السببية، فعندئذ يمكننا التنبؤ بالارتباطات في البيانات من خلال قاعدة رسومية بسيطة. من خلال إنشاء مخطط مسار لتمثيل هذه العلاقات ، أظهر رايت أن عوامل النمو لها تأثير على فترة الحمل التي يكون لها تأثير على نمط المعطف ، وما إلى ذلك.
من خلال تحويل هذا المخطط المسار إلى معادلة رياضية، كان رايت قادرا على تحديد أن 42 في المئة من الاختلاف في نمط معطف كان بسبب الوراثة، و 58 في المئة كان النمو. ثم انتقل في وقت لاحق إلى نشر ورقة عامة تسمى “الارتباط والسببية” تشرح كيف يعمل تحليل المسار في بيئات أخرى غير تربية الخنازير الغينية. بطبيعة الحال، ونظرا للعصر، تعرض رايت للانتقاد وجادل أقرانه بالنتائج التي توصل إليها وفضحها. ومع ذلك، لم يكن أقرانه يعرفون أن النتائج التي توصل إليها رايت كانت مجرد بداية للثورة السببية.
الفصل 2: يجب علينا استخدام بيانات غير واقعية لفهم النتائج حقا
بالنسبة للعلماء، البيانات هي كل شيء. البيانات ضرورية عند محاولة تحديد السبب الكامن وراء تأثير أو العكس بالعكس. لذلك، يعتمد العلماء على البيانات في الكثير من أعمالهم. لسوء الحظ، يمكن أن تكون البيانات منحرفة ويمكن أن تؤدي إلى تفسيرات خاطئة. لإظهار مدى أهمية البيانات ومحوريتها، دعونا نلقي نظرة على النقاش العام الذي اندلع في أوروبا عندما تم إدخال لقاح الجدري.
وعلى نحو غير متوقع، أظهرت البيانات أن عدد الأشخاص الذين توفوا بسبب لقاح الجدري أكبر من عدد الأشخاص الذين توفوا بسبب الجدري نفسه. وبطبيعة الحال، استخدم بعض الناس هذه المعلومات للقول بأنه ينبغي حظر اللقاح، على الرغم من أنه كان في الواقع ينقذ الأرواح ويقضى على المرض. وإليك كيف أصبحت هذه البيانات منحرفة: “لنفترض أنه من بين مليون طفل، يتم تطعيم 99 في المائة وواحد في المائة منهم. إذا تم تطعيم طفل. لديه فرصة واحدة في مائة من تطوير رد فعل ، ورد الفعل لديه فرصة واحدة في مائة من كونه قاتلا”. وبعبارة أخرى، فإن الأرقام تصل إلى 99 حالة وفاة. وفي الوقت نفسه، لا يحصل 10,000 شخص على التطعيم، ويحصل 200 شخص على الجدري، ويموت 40 آخرون بسبب المرض. وباختصار، يموت عدد من الأطفال بسبب التطعيم (99) أكثر من عدد الأطفال الذين يموتون بسبب المرض (40).”
وبطبيعة الحال، كان الآباء يسيرون إلى وزارة الصحة مع لافتات تقول: “اللقاحات تقتل!” هل يمكنك لومهم؟ بدت البيانات وكأنها إلى جانبهم، ولكن يجب أن نلقي نظرة فاحصة على الأرقام لفهم البيانات حقا. وعلينا أن نسأل أنفسنا، “ماذا لو وضعنا معدل التطعيم عند مستوى الصفر؟” لو كان الأمر كذلك، يمكننا أن نستنتج أنه من بين مليون طفل، كان 20,000 طفل سيإصابة بالجدري، و4,000 ماتوا. وعندما نضاءل العالم المناقض للواقع مع العالم الحقيقي، نرى أن عدم التطعيم كان سيكلف حياة 861 3 طفلا.
وعلاوة على ذلك، يمكن استخدام البيانات لإظهار العلاقة بين حجم حذاء الطفل وقدرته على القراءة. “الأطفال الذين يعانون من أحذية أكبر يميلون إلى القراءة على مستوى أعلى. ولكن العلاقة ليست علاقة السبب والنتيجة. إعطاء طفل أحذية أكبر لن يجعله يقرأ بشكل أفضل!” بدلا من ذلك، يمكن تفسير المتغيرات حسب عمر الطفل. كلما كان الطفل أكبر سنا، كلما كانت القدرة على القراءة أفضل. بيرسون تفتقر إلى الحس السليم مماثلة عند جعل علاقة جائزة نوبل مع تناول الشوكولاته. على سبيل المثال، إذا نظرنا فقط إلى البالغين من العمر سبع سنوات، فعندئذ يمكننا أن نتوقع عدم رؤية أي علاقة بين حجم الحذاء والقدرة على القراءة. إنه هذا النوع من التقاطع الذي يسمح لنا بالبدء في تسلق سلم السببية.
الفصل 3: الخطوة الأولى من سلم السببية تتعامل مع الملاحظة السلبية
كانت قصة آدم وحتى في جنة عدن هي التي جعلت المؤلفة يهودا بيرل تعترف بخلق المعرفة الإنسانية والفهم. ويذكر بأنه كان قلقا بشأن “فكرة أن ظهور المعرفة الإنسانية لم يكن عملية بهيجة بل عملية مؤلمة، مصحوبة بالعصيان والشعور بالذنب والعقاب”. هل المعرفة البشرية تستحق التخلي عن حياة خالية من الهموم في عدن؟ بالتأكيد، كانت الثورات الزراعية والعلمية التي تلت ذلك تستحق كل المصاعب الاقتصادية والحروب والمظالم الاجتماعية للحياة الحديثة، أليس كذلك؟ هذا السؤال الفلسفي هو ما دفع بيرل لمواجهة سلم السببية. أدرك أن الله سأل حواء، “ما الذي فعلته؟” فأجابت حواء: “الثعبان خدعني، وأنا أكلت”. كان الله يسأل حواء “ماذا”، وأجابت حواء، “لماذا”. طلب الله الحقائق وتلقى تفسيرات. وبعبارة أخرى، كان البشر دائما مفتونين بتعقيدات العلاقات بين السبب والنتيجة.
هناك ثلاثة مستويات من السببية أو ثلاث درجات من السلم. معظم الحيوانات، فضلا عن آلات التعلم في الوقت الحاضر، هي على الدرجة الأولى، والتعلم عن طريق الارتباط. على سبيل المثال ، هذا ما تفعله البومة وهي تلاحظ تحرك فريستها وتكتشف أين سيكون القوارض في الوقت الذي تضرب فيه البومة. البومة لا تهتم بسؤال السبب وبالمثل ، يقوم برنامج Go بالكمبيوتر بذلك عندما يدرس قاعدة بيانات لملايين ألعاب Go لمعرفة التحركات المرتبطة بنسبة أعلى من الانتصارات. تعتمد هذه الدرجة الأولى على إجراء تنبؤات تستند إلى ملاحظات سلبية وتتميز بالسؤال ، “ماذا لو رأيت…”
على سبيل المثال، قد يسأل مدير التسويق مديرا في متجر كبير، “ما مدى احتمال أن يشتري العميل الذي اشترى معجون أسنان أيضا خيط تنظيف الأسنان؟” مثل هذه الأسئلة هي أساس الإحصاءات، والخطوة الأولى في الإجابة عليها هي عن طريق جمع وتحليل البيانات. للإجابة على هذا السؤال ، يجب علينا أولا أن ننظر إلى البيانات المتعلقة بسلوك التسوق للعملاء الذين اشتروا معجون الأسنان. يجب علينا بعد ذلك حساب نسبة أولئك العملاء الذين اشتروا أيضا خيط تنظيف الأسنان. وتسمى هذه النسبة احتمال مشروط، ويمكننا أن نكتب رمزيا مثل هذا: P (الخيط | معجون الأسنان) أو “ما هو احتمال الخيط، بالنظر إلى أن ترى معجون الأسنان؟”
ويستخدم الإحصائيون أساليب مثل تلك المذكورة أعلاه لتحديد الارتباطات بين المتغيرات؛ ومع ذلك، لا يمكن أن تخبرنا الإحصاءات وحدها عن السبب والنتيجة. هل معجون الأسنان أو الخيط هو السبب؟ بالنسبة لمدير المبيعات ، لا يهم حقا. “التنبؤات الجيدة لا تحتاج إلى تفسيرات جيدة. البومة يمكن أن يكون صياد جيد دون فهم لماذا الجرذ يذهب دائما من نقطة A إلى النقطة باء . تفتقر الأنظمة التي تعمل في المستوى الأول من سلم السببية إلى المرونة والقدرة على التكيف ، ولكن عندما نصعد إلى المستوى التالي من الاستفسارات السببية ، نبدأ في تغيير العالم. أسئلة مثل ، “ماذا سيحدث لمبيعات الخيط لدينا إذا كنا ضعف سعر معجون الأسنان؟” يتطلب نوعا جديدا من المعرفة التي سنجدها في الدرجة الثانية من سلم السببية.
الفصل 4 : الدرجة الثانية من سلم السببية هو عن اتخاذ إجراءات
الاستعلام تعريف الدرجة الثانية من سلم السببية هو “ماذا لو فعلنا…” أو ، “إذا غيرنا البيئة ، ماذا سيحدث؟” “القيام به” مهم. وتتميز الدرجة الثانية بالتأثير النشط على النتائج، على عكس الدرجة الأولى التي تعتمد فقط على الملاحظة السلبية. كيف سيؤثر مضاعفة سعر معجون الأسنان على مبيعات الخيط؟ يمكننا كتابته رمزيا مثل هذا: P (الخيط | القيام به (معجون الأسنان)، الذي يسأل عن احتمال بيع الخيط بسعر معين، نظرا لأننا وضعنا سعر معجون الأسنان بسعر آخر.
بالإضافة إلى ذلك، قد يدرك المدير أن لديه الكثير من معجون الأسنان في المستودع. لذا، يسأل السؤال، “كيف يمكننا بيعه؟” أو “ما هو السعر الذي يجب أن نبيعه من أجل؟” تتطلب هذه الأسئلة إجراء، تدخلا، نقوم به ذهنيا قبل أن نقرر نوع الإجراء الذي يجب القيام به. وهذا يتطلب نموذجا سببيا. في الواقع، نحن نقوم بتدخلات مثل هذه في حياتنا اليومية طوال الوقت. على سبيل المثال، إذا كنت يعاني من صداع، فقد تأخذ الأسبرين لعلاجه. تتدخل على متغير واحد للتأثير على متغير آخر.
على عكس الدرجة الأولى من السلم، لا يمكن لأجهزة الكمبيوتر إجراء على الدرجة الثانية. ولا يمكنهم الإجابة على هذه الأنواع من الأسئلة؛ بل إنهم لا يستطيعون الإجابة على هذه الأسئلة. بعد كل شيء ، وأجهزة الكمبيوتر ليست مثل البشر الذين يفهمون علاقات السبب والنتيجة. البشر، من ناحية أخرى، لديهم القدرة على اختبار تأثير شيء من خلال التجارب التي تسيطر عليها، وهو شيء البشر قد تم القيام به منذ العصور التوراتية. كما ترى، عندما تم تكليف أشبيناز، المشرف على بلاط الملك نبوخذ نصر بتحديد أفضل النبلاء الأسرى للعمل في المحكمة، واجه مشكلة. وكجزء من تعليم هؤلاء الأطفال، يمكنهم تناول اللحوم الملكية وشرب النبيذ الملكي. بالطبع، هذا هو المكان الذي حدثت فيه المشكلة.
أحد المفضلين لديه، صبي يدعى دانيال، رفض أكل اللحم لأسباب دينية. لم يستطع دانيال أكل اللحوم التي لم يتم إعدادها وفقا للقوانين اليهودية، لذا طلب منه هو وأصدقاؤه أن يعطوا نظاما غذائيا من الخضروات بدلا من ذلك. ولإثبات أن الخضروات لن تؤثر على أدائها، طلب دانيال من أشبيناز إجراء تجربة خاضعة للرقابة. لمدة عشرة أيام، أربعة منهم فقط يتم إطعام الخضروات في حين أن بقية الولائم على لحوم الملك والنبيذ. وبعد عشرة أيام، سيقارنون المجموعتين. أثبتت نتائج التجربة أن النظام الغذائي النباتي أعطى دانيال ورفاقه الثلاثة المزيد من القوة والقدرة على التحمل العقلي. في الواقع، كان الملك معجبا جدا، لدرجة أنه أعطى كل واحد منهم مكانا مفضلا في بلاطه.
كما ترى، عندما واجه أشبيناز مشكلة دانيال، سأل سؤالا حول السببية: هل سيؤدي النظام الغذائي النباتي إلى فقدان الخدم وزنهم؟ للإجابة على هذا السؤال، اقترح دانيال تجربة خاضعة للرقابة من خلال إنشاء مجموعتين من الأشخاص الذين كانوا متشابهين بطرق عديدة ومقارنة الاثنين بعد بعض الوقت. في حين أن تجربة دانيال كانت حديثة بشكل لافت للنظر في وقته ، إلا أنه لم يفكر في شيء واحد: التحيز المحير (الذي سنستكشفه لاحقا بمزيد من العمق). على سبيل المثال ، إذا كانت مجموعة دانيال أكثر صحة بشكل عام من مجموعة التحكم ، فلن يكون لنظامهم الغذائي أي علاقة بمظهرهم الصحي! التفكير في جميع العوامل المتغيرة التي تؤثر على تجربة يقودنا إلى الدرجة الثالثة والأخيرة من سلم السببية.
الفصل 5: الدرجة الثالثة من سلم السببية حول تحديد الكونتراكتيوالات
في الفصل السابق ، ناقشنا العلاقة السببية لأخذ الأسبرين لعلاج الصداع. بمجرد أن يختفي هذا الصداع، قد تبدأ في التساؤل لماذا ذهب الآن. هل كان الأسبرين الذي أخذته؟ الطعام الذي أكلته؟ الأخبار الجيدة التي سمعتها؟ انها هذه الأنواع من الاستفسارات التي تجلب لنا إلى أعلى تشغيل سلم السببية، ومستوى الحقائق المضادة. الحقائق العكسية تتطلب منا العودة بالزمن إلى الوراء، وتغيير التاريخ، والسؤال “ماذا كان سيحدث لو لم أكن قد تناولت الأسبرين؟”
الحقائق العكسية ، على عكس البيانات ، ليست دائما واقعية. ولكن الدماغ البشري يبحث باستمرار عن تفسيرات لمثل هذه السيناريوهات. على سبيل المثال، أوضحت حواء أن سبب أفعالها هو أن الثعبان خدعها. وهذه القدرة هي التي تميز البشر عن الذكاء الحيواني والآلات. في الواقع، نرى الحقائق العكسية طوال الوقت في قاعة المحكمة لأنها قديمة جدا ومعروفة في مهنة المحاماة باسم “ولكن للسببية”. على سبيل المثال، “إذا أطلق المدعى عليه النار وأصابت الرصاصة الضحية وقتلتها، فإن إطلاق النار هو سبب الوفاة، أو ضروري، لأن الضحية سيكون على قيد الحياة لولا إطلاق النار”. وبالمثل ، إذا كان جو كتل مخرج الحريق مع الأثاث وجودي يموت في الحريق لأنها لا تستطيع الهرب ، ثم جو هو المسؤول قانونا عن وفاتها على الرغم من انه لم يشعل النار نفسها.
بالحديث عن النار، مثال كلاسيكي يوضح السببية الضرورية هو حريق اندلع بعد أن ضرب شخص ما مباراة. قد يجادل الكثيرون بأن الحريق لم يكن ليحدث لولا إشعال المباراة، لكنهم ينسون أن يأخذوا وجود الأكسجين في الاعتبار. نتجاهل العلاقة السببية بين الأكسجين والنار. على عكس البشر، لا يمكن للكمبيوتر التفكير من حيث العلاقات السببية. وفقا لجهاز كمبيوتر، فإن كلا من المباراة والأوكسجين تلعب دورا متساويا في الحريق لأنها على حد سواء الأسباب الضرورية. ونتيجة لذلك، سيحدد الكمبيوتر أن الأكسجين هو المسؤول عن الحريق.
وعلاوة على ذلك، من المرجح أن يحسب الحاسوب المطابقة كسبب كاف للحريق. في حين أن وجود كل من المباراة والأوكسجين على حد سواء ضرورية للحريق لاندلع، يمكن للكمبيوتر السبب في أن المباراة كانت مسؤولة بما فيه الكفاية، مما يجعلها سبب الحريق. كل هذا يعني ببساطة أن الأسباب الضرورية والكافية حاسمة للإجابة على الأسئلة السببية وتلعب دورا هاما في الدرجة الثالثة من سلم السببية. ولكن الآن بعد أن فهمت الدرجات الثلاث، ما هي الخطوة التالية؟
الفصل 6: التحيز المحير هو متغير ثالث كامن يجب على العلماء أن يأخذوا في الاعتبار
كما ذكرنا في الفصل السابق، التجارب الخاضعة للرقابة كانت موجودة منذ فترة طويلة مثل البشر. ذكرنا أيضا أن تجربة دانيال كانت حديثة في جميع النواحي باستثناء واحدة: فشل في أخذ التحيز المحير في الاعتبار. “يحدث التحيز المحير عندما يؤثر متغير على كل من يتم اختياره للعلاج ونتائج التجربة. ” بالإضافة إلى ذلك ، ترتبط عادة بالدرج الثاني من سلم السببية ، مما يعني أن التدخل مطلوب لتعديل التجربة.
على سبيل المثال، إذا كنت تختبر دواء وأعطيته للمرضى الأصغر سنا في المتوسط من الأشخاص في مجموعة التحكم، فإن العمر يصبح مرتبكا. يصبح العمر “متغيرا ثالثا كامنا”. إذا لم تكن هناك بيانات عن الأعمار على الإطلاق ، فلا يمكن بالضرورة الوثوق بنتائج الاختبار أو صحتها. ولكن إذا كنا نعرف المتغير المحير Z هو العمر، ثم يمكننا مقارنة مجموعات العلاج والسيطرة في كل فئة عمرية على حدة. في هذا السيناريو، يمكننا أن نأخذ متوسط الآثار، ترجيح كل فئة عمرية وفقا للنسبة المئوية في السكان المستهدفين. وتسمى طريقة التعويض هذه “التكيف مع Z” أو “التحكم في Z”.
ومع ذلك ، ليس من السهل دائما التعويض عن التحير. على سبيل المثال، في الخمسينيات والستينات من القرن العشرين، كان من الممكن أن يكون المشوشون على أي شيء تقريبا. وأشار البعض إلى أنه يمكن أن يكون هناك جين تدخين يتسبب في اشتهاء الناس للسجائر وجعلهم أكثر عرضة للإصابة بسرطان الرئة. وبطبيعة الحال، كانت هناك طريقة سهلة للإحصائيين لاختبار تأثير التدخين من خلال تجربة معشاة ذات شواهد (RCT) حيث يتم تعيين العلاج، مثل التدخين، بشكل عشوائي لبعض الأفراد وليس للآخرين ثم تتم مقارنة التغييرات الملاحظة. ولكن العشوائية، في هذه الحالة، لم تكن أخلاقية بالتأكيد. لم يتمكن الباحثون من تعيين مجموعة عشوائية من الناس للتدخين لمدة 30 عاما لاختبار الصلة بالسرطان ، ويمكن أن تكون النتائج قاتلة!
بطبيعة الحال، لم يكن النقاش بين التدخين والسرطان حول التبغ أو السرطان. كان كل شيء عن كلمة “تسبب” غير مؤذية، ولم تكن المرة الأولى التي يواجه فيها الأطباء أسئلة سببية محيرة. في الواقع ، كان منتصف 1700s عندما اكتشف جيمس ليند أن الحمضيات يمكن أن تمنع الاسقربوط. ولكن الآن نحن نواجه السؤال، “ما هو حول الحمضيات التي تمنع الاسقربوط؟” في ذلك الوقت، لم يتم اختراع الفيتامينات حتى الآن، لذلك لم يتمكن العلماء من تحديد الحمضيات التي عملت بشكل أفضل من غيرها في الوقاية من المرض. لذا إذا كنا لا نعرف لماذا يعمل البرتقال، قد نميل إلى تجربة ثمرة أخرى إذا نفذ منا البرتقال.
لذلك، يستخدم العلماء الوساطة للمساعدة في الإجابة على هذه الأنواع من الأسئلة. الوسيط للاسقربوط هو فيتامين C. للأسف، عانت بعثتان لروبرت فالكون سكوت إلى القارة القطبية الجنوبية في 1903 و 1911 بشكل كبير من الاسقربوط بسبب شيء واحد: لم يعرفوا الوسيط. بالتأكيد ، كان من المعروف أن الحمضيات منعت الاسقربوط ولكن يعتقد الكثيرون أنه كان نتيجة لحموضة الفاكهة. الرسم البياني السببي كان الحمضيات → الحموضة → الاسقربوط. من وجهة النظر هذه، كوكا كولا ستعمل! عند سماع أنه على الرغم من تناول عصير الجير ، أصبح العديد من المستكشفين مرضى ، فقد صدم المجتمع الطبي وارتبك. لم يكن حتى عام 1930 أن ألبرت Szent-Gyorgi اكتشف أنه كان حمض الأسكوربيك أو فيتامين (ج) التي كانت المغذيات الخاصة التي منعت الاسقربوط, تغيير المسار السببي إلى الحمضيات → فيتامين (ج) → الاسقربوط.
الفصل 7: العلاقات السببية والفكر البشري هو مفتاح الذكاء الاصطناعي
العلاقات السببية هي جزء مهم من اكتشاف الإنسان. إذا لم نسأل “لماذا؟” ثم نحن أبدا جعل اكتشافات جديدة! ولكن هل يمكننا تعليم الآلات فهم الأسباب والآثار أيضا؟ للإجابة على هذا السؤال، سنحتاج إلى إلقاء نظرة على النماذج السببية والبيانات الضخمة. اليوم ، لدينا بيانات خام أكثر من أي وقت مضى مع تحرك عالمنا نحو منصة عبر الإنترنت. “على سبيل المثال، في عام 2014، أفادت التقارير أن فيسبوك كان ي تخزين 300 بيتابايت من البيانات حول مستخدميه النشطين الذين يبلغ عددهم 2 مليار مستخدم. كانت لديهم بيانات عن الألعاب التي يلعبها الناس، والمنتجات التي يشترونها، وأسماء أصدقائهم على فيسبوك، وبالطبع، جميع مقاطع الفيديو الخاصة بالقط!” ولكن كما أن بياناتنا على الإنترنت آخذة في النمو، فإن بياناتنا في مجال العلوم آخذة في الازدياد. على سبيل المثال، جمع مشروع الجينوم 1000 مائتي تيرابايت من المعلومات فيما يسميه “أكبر كتالوج عام لبيانات الاختلاف البشري والنمط الجيني”. ولكن كيف يمكننا استخراج المعنى من كل هذه الأرقام والبتات والبيكسلات؟ حسنا، في حين أن البيانات تبدو هائلة، فإن الأسئلة بسيطة: “هل هناك جين يسبب سرطان الرئة؟ ما هي أنواع الأنظمة الشمسية التي من المرجح أن تؤوي كواكب شبيهة بالأرض؟ ما هي العوامل التي تتسبب في انخفاض عدد الأسماك المفضلة لدينا، وماذا يمكننا أن نفعل حيال ذلك؟” يعتقد الكثيرون أن الإجابات على هذه الأسئلة سيتم العثور عليها في البيانات، ولكن كما تعلمون الآن، هذه كلها أسئلة سببية لا يمكن الإجابة عليها على البيانات وحدها.
لذلك ، يجب أن تعمل البيانات الضخمة والاستدلال السببي معا لتحديد الإجابات. الخطوة الأولى هي رسم رسوم بيانية سببية كما رأينا في الفصل السابق. بمجرد رسم رسم تخطيطي، يصبح من الممكن إنشاء صيغة رياضية توضح العلاقة القائمة بين الارتباط والسببية. في الرسم البياني السببي، يمكننا أن نرى بوضوح جميع العوامل المعروفة في مكان واحد. ثم يتم ربط هذه العوامل جنبا إلى جنب مع الأسهم، مما يدل على كيفية تأثير واحد مباشرة على آخر. وبمجرد ربطهما، يصبح من الممكن معرفة أيهما وسيط وما هو المشوش. على سبيل المثال، لنبدأ بافتراض أن ضغط الدم معروف بأنه سبب محتمل للنوبة القلبية، ومن المفترض أن يقلل الدواء B من ضغط الدم. قد يبدأ الباحثون برسم رسم تخطيطي مع أسهم تربط بين الدواء وضغط الدم والعمر وضغط الدم والدواء والعمر.
كما تعلمون، يؤثر العمر على كل من ضغط الدم والعمر، بغض النظر عن الدواء، ويرتبط بكل من العوامل مع السهم الذي يشير في اتجاهين، والذي يسمح لنا أن نرى أن العمر هو confounder. من هنا، يمكن التعبير عن الرسم التخطيطي في صيغة. ولأننا حولنا العلاقة السببية إلى عملية منطقية خطوة بخطوة، يمكننا بعد ذلك إدخال عملية السبب والنتيجة هذه إلى روبوتات وحواسيب. ويمكن بعد ذلك استخدام الصيغة لحساب الإجابة وعدم اليقين الإحصائي في تلك الإجابة. وبعبارة أخرى ، فإن هذا يعني أن أجهزة الكمبيوتر ستكون قادرة في النهاية على السؤال لماذا؟
الفصل 8: الملخص النهائي
“الارتباط ليس السببية” منذ فترة طويلة مقبولة في المجتمع العلمي ، ولسبب وجيه! بالتأكيد، يمكن ربط صياح الديك مع شروق الشمس، لكنه لا يسبب شروق الشمس. المشكلة، ومع ذلك، هو أن هناك سوء فهم كبير حول ما هو السببية. اليوم، نحن نفهم أن السببية تتشكل مثل سلم مع ثلاث درجات. كما يمكنك تسلق السلم، أسئلتك تصبح أكثر تعقيدا وتتطلب فهما أفضل للعلاقات السببية. بالإضافة إلى ذلك، من خلال المنهجية الصحيحة، من الممكن تحديد متى يعني الارتباط السببية. بل وأكثر من ذلك، يمكن بعد ذلك برمجة هذه الطريقة في أجهزة الكمبيوتر، مما يسمح لهم بالإجابة على الأسئلة السببية. أجهزة الكمبيوتر قادرة على الإجابة لماذا هو مفتاح الذكاء الاصطناعي ولديه القدرة على فتح عالم من الاحتمالات للاكتشافات العلمية والتقدم.

اترك تعليقًا

إملأ الحقول أدناه بالمعلومات المناسبة أو إضغط على إحدى الأيقونات لتسجيل الدخول:

شعار ووردبريس.كوم

أنت تعلق بإستخدام حساب WordPress.com. تسجيل خروج   /  تغيير )

Google photo

أنت تعلق بإستخدام حساب Google. تسجيل خروج   /  تغيير )

صورة تويتر

أنت تعلق بإستخدام حساب Twitter. تسجيل خروج   /  تغيير )

Facebook photo

أنت تعلق بإستخدام حساب Facebook. تسجيل خروج   /  تغيير )

Connecting to %s