האם מכוני כושר הם מקור להתפרצות קורונה?

אני אתחיל בהתנצלות: אין לי מושג מה התשובה לשאלה שבכותרת. אני לא חושב שלמישהו יש מושג. אבל משום מה, הנושא של סגירת מכוני הכושר הפך בימים האחרונים לוויכוח ציבורי לוהט, ולכן החלטתי להפסיק את שתיקתי בעניינים הקשורים למגיפת הקורונה. אבל אם הגעתם עד לכאן, אודה לכם אם תקראו לפחות את הפיסקה הבאה.

מה תמצאו בפוסט הזה? ראשית אביא סקירה מאוד קצרה למה שידוע לנו על הנושא נכון לעכשיו. לאחר מכן אדון בשאלה איך למצוא תשובה לשאלה שבכותרת (או שאלות דומות). לסיום אביא את דעתי האישית בנושא.

מה ידוע על הקשר בין פעילות מכוני הכושר והתחלואה בקורונה?

מה אנחנו יודעים על הקשר בין הדבקות בקורונה ובין פעילות חדרי הכושר? בשתי מילים: כמעט כלום.

הלכתי לשאול את ד"ר גוגל מה הוא חושב. מילות החיפוש שלי היו "covid-19 gym reopening". אסקור כאן את שלוש התוצאות הראשונות (( לאחר מכן המקורות מתחילים להיות מפוקפקים. התוצאה הרביעית הייתה מאתר בשם mindbodyonline נקודה קום, והחמישית מאתר מסחרי בשם europeactive נקודה אי.יו. שעוסק בקידום פעילויות ספורט. ))

תוצאת החיפוש הראשונה היא כתבה בכתב העת science ב-26.6.2020. הנה הכותרת: It’s safe to go back to the gym—if there’s little COVID-19 around, study suggests ובעברית: אין בעיה להתאמן במכוני הכושר אם אין שם חולי קורונה. מדובר במחקר שנעשה בנורבגיה (( קישור למחקר – קובץ פדף )). החוקרים גייסו לניסוי כ-4000 איש, כולם מנויים בחדרי כושר בעיר אוסלו וכולם לא עברו בדיקות קורונה בחודשים מאי עד יוני 2020. כמחצית מהנבדקים קיבלו אפשרות להתאמן במשך שבועיים בחמישה חדרי כושר שנפתחו במיוחד לצורך המחקר. בחדרי הכושר האלה נשמרו כל התנאים הנדרשים: מרחק של שני מטר, מסיכות, וניקוי המכשירים בסיום השימוש. שאר המשתתפים בניסוי היוו את קבוצת הביקורת. מלבד המשתתפים בניסוי היחידים ששהו בחדרי הכושר היו אנשי הצוות. התוצאות: כעבור שבועיים זוהה חולה אחד בקבוצת המתאמנים, ואף לא אחד בקבוצת הביקורת. נחמד. הבעיה: במשך תקופת הניסוי מספר החולים החדשים באוסלו היה נמוך מאוד: 105 בסך הכל, כ-8 חולים ליום בממוצע. יותר מכך: מספר החולים המאושפזים בעיר, שמהווה אינדיקציה למספר החולים הכללי, ירד מ-35 בתחילת תקופת המחקר ל-21 בסיומה. לסיכום, הכותרת של הכתבה אכן מאוד מדוייקת: אם אין חולים אז אין ממי להידבק, אפילו לא בחדר הכושר. השורה התחתונה של המחקר הזה: לא למדנו ממנו שום דבר משמעותי.

תוצאת החיפוש השניה היא מהאתר של השידור הציבורי בארצות הברית, NPR. מתאריך 5.7.2020. הכותרת: My Gym Is Reopening. Is It Safe To Work Out There?  עיקר הכתבה הוא ראיונות עם מומחים שונים. המסרים: כל אחד צריך להעריך את הסיכון שלו, עדיף להתאמן בבית או באוויר הפתוח, אם בכל זאת הולכים לחדר כושר לבדוק איזה אמצעי זהירות הם נוקטים, לשים לב לזרימת האוויר ועוד ועוד. ההמלצה המודגשת ביותר: אם יש באיזור שבו אתה נמצא הרבה חולים, הסיכון שלך להידבק בחדר הכושר גדול יותר. ממש כמו שהמחקר הנורבגי גילה. בכתבה יש גם הפניה למחקר תצפיתי בהיקף קטן שנעשה בדרום קוריאה (( מצאתי אותו גם בגוגל סקולר )). ההמלצה של המחקר הזה אינה שונה מההמלצות הקודמות.

התוצאה השלישית היא מהוול-סטריט ג'ורנל: Gyms Reopening May Not Facilitate Coronavirus Infections, Study Finds. הכתבה נמצאת מאחורי חומת תשלום, אבל מהמעט שאפשר לקרוא עולה כי היא מתייחסת לאותו מחקר נורבגי. העורכים של העיתון, כפי שאני מסיק מהכותרת, סבורים כי התוצאות של המחקר הזה דווקא מעודדות, למרות ההסתייגות שהוכנסה שם (( "may not…" ))

בגוגל סקולאר, מלבד מהמחקר הקוריאני, לא מצאתי שום מחקר שמביא נתונים כמותיים בעניין בין עשר התוצאות הראשונות.

איך אפשר לאסוף נתונים על הסיכון לתחלואה בקורונה בחדרי הכושר?

מי שהגיע לכאן, ובפרט מי שעוקב אחרי הבלוג הזה לאורך השנים, כבר יודע את התשובה: צריך לעשות ניסוי מבוקר. הנורבגים עשו בדיוק את זה.

אני מסתייג מהמחקר הזה בגלל מספר סיבות. הסיבה הראשונה היא כל מיני עניינים שקשורים לתכנון המחקר. למשל, המתאמנים לא התאמנו בחדרי הכושר שבהם הם מתאמנים בדרך כלל אלא חדרי כושר שנפתחו במיוחד עבור המחקר. זה יוצר הטיה, כי מכונים אלה לא בהכרח מייצגים את כל המכונים. לא נאמר איך חמשת המכונים האלה נבחרו. כמו כן, לא נמסרו פרטים על גודלם של המכונים, מספר האנשים שכל מכון יכול להכיל, ועד כמה צפיפות המתאמנים במהלך הניסוי הייתה דומה לצפיפות בזמן שגרה. בעיה נוספת שאני רואה היא משך תקופת המעקב – שבועיים בלבד. החוקרים לא לקחו את משך תקופת המעקב בחשבון כאשר חישבו את גודל המדגם. אם חדרי הכושר היו נפתחים לתקופה ארוכה יותר סביר להניח שהיינו רואים יותר הדבקות, וייתכן שההבדלים בין הקבוצות יהיו שונים. כמו כן, לא נעשה שקלול על פי מספר הפעמים שבהם כל אחד מהנבדקים בקבוצת הניסוי התאמן, אבל בדיעבד זה לא משנה לאור התוצאה של מקרה הדבקה בודד בכל הניסוי.

בעיה שניה: הניסוי השווה בין מתאמנים ללא מתאמנים, ולא בדק את ההשפעה הכוללת של הפתיחה על כלל האוכלוסייה. קשה להאשים כאן את החוקרים. אני לא רואה דרך סבירה לבדוק את זה.

בעיה שלישית: המחקר לא עונה, ולא יכול לענות, על השאלה האם יש קשר בין שיעור התחלואה הכולל ושיעור ההדבקה בין המתאמנים. כן, ראינו כי כאשר שיעור התחלואה באוכלוסייה נמוך אז שיעור ההדבקה בחדרי הכושר על משך תקופה של שבועיים הוא אפסי. אבל מה יקרה אם שיעור התחלואה באוכלוסייה יעלה? סביר להניח שגם שיעור ההדבקות בחדרי הכושר יעלה, אבל אין לנו מידע על מספיק על אופי הקשר.

עם זאת, אני מבין את הקשיים בפניהם עמדו החוקרים. אולי היה אפשר לתכנן את הניסוי טוב יותר, אבל זו חכמה של צופה מהצד.

אני רוצה להציע תכנון אחר, שנראה לי יותר הגיוני: לדגום אוכלוסיית מחקר של מכוני כושר, ולא של מתאמנים. לאחר מכן, נקבע על ידי הקצאה רנדומלית איזה מכונים ייפתחו ואיזה יישארו סגורים (( אני לא אכנס כאן לפרטי הדגימה וההקצאה. אני מודע לכך שאני כותב כאן בצורה פשטנית, והתהליך הרבה יותר מורכב)). אני בהחלט חושב שתקופת מעקב של שבועיים אינה מספיקה, והתחושה שלי היא שהתקופה צריכה לארוך לפחות חודש, אם לא יותר מכך. ההשוואה תהיה דומה להשוואה שעשו הנורבגים: השוואת שיעור הנדבקים בין המנויים בחדרים שנפתחו לבין המנויים במכונים שנשארו סגורים.

יש עוד אפשרות, פחות טובה. יש לנו כבר את נתוני ההדבקה מהתקופה שבה מכוני הכושר היו סגורים. בואו נפתח עכשיו את חדרי הכושר ונראה אם יחול שינוי. הבעיה היא כמובן שאנחנו לא חיים בחלל ריק. אי אפשר רק לפתוח את מכוני הכושר ולהשאיר את כל הגורמים האחרים קבועים. עם זאת, אנחנו עושים את זה הלכה למעשה כל הזמן. אנחנו מסתכלים על השינויים בתחלואה ומנסים למצוא קשר לכל מיני דברים: בתי ספר סגורים, אוטובוסים עם חלונות פתוחים, בתי הספר שוב נפתחים, ושוב נסגרים, 100 מטר, 500 מטר, חתונות קטנות, חתונות עד 250 איש, חתונות עד 100 איש, אני אעצור כאן ברשותכם.

אז מה לעשות עם חדרי הכושר?

רק אתמול קראתי באתר ynet כי חדרי הכושר, הבריכות וחלק מהמסעדות נסגרו כחלק מהגבלות הקורונה החדשות – אבל יו"ר ועדת הקורונה יפעת שאשא-ביטון דורשת קבלת נתונים לפני שתאשר את אותן הגבלות. שאשא-ביטון אמרה בריאיון לאולפן ynet כי הממשלה קיבלה את ההחלטה מבלי להציג נתונים – ובשלב זה אין בכוונתה לאשר את צו הסגירה. "נקבל את הנתונים ונחליט עד מחר", הוסיפה.

אני לא בא להשמיץ את ח"כ שאשא-ביטון. לדרוש נתונים זו דרישה סבירה לגמרי. אני תומך נלהב של קבלת החלטות על סמך נתונים.

אבל היא גם אמרה, בראיון לרדיו 103FM (קישור לראיון המוקלט), כי "אם משרד הבריאות לא יוכיח שבריכות, חדרי כושר ומסעדות הם מקור התפרצות, נבטל ההנחיות".

אז הנה הבעיה: אין נתונים  על חדרי כושר, וכנראה שגם לא על מסעדות ובריכות ((מי שמעוניין מוזמן לבדוק)), ובטח שאין נתונים אמינים על מה שקורה בישראל. משרד הבריאות לא יכול להוכיח שחדרי כושר הם מקור התפרצות, אבל גם לא יכול להוכיח שלא. והחלטה צריך לקבל בכל מקרה. שאשא-ביטון החליטה למעשה שאם אין נתונים שמראים כי חדרי כושר הם מקור התפרצות, אז בהכרח חדרי כושר אינם מקור התפרצות. אני חולק על דעתה. אבל אל תטעו, אפשר גם לטעון את הטענה ההפוכה:  שאם אין נתונים שמראים כי חדרי כושר אינם מקור התפרצות, אז בהכרח חדרי כושר הם מקור התפרצות. שתי הטענות סובלות מאותו כשל לוגי.

ושוב, אין לי שום דבר אישי נגד חברת הכנסת, כולנו עומדים בפני אותה הדילמה, לכל אחד יש דיעה, ומאוד סביר להניח שרבים חושבים כמו שאשא-ביטון, לכיוון כזה או אחר. היא פשוט בולטת בגלל התפקיד שהיא ממלאת והאחריות שהיא נושאת על כתפיה. וגם אם פורמלית יש כאן כשל לוגי, אי אפשר לומר שאין הגיון במה שהיא אומרת. אני בטוח כי היא חשבה על הנושא ולקחה בחשבון עוד שיקולים שצריך לקחת בחשבון, כמו שיקולים כלכליים ודאגה לרווחת הציבור.

אין נתונים, אין ברירה וצריך להחליט בלעדיהם. אפשר לבצע ניסוי כמו שעשו בנורבגיה. אפשר לנסות להניח הנחות, לבנות מודל, לבדוק עד כמה הוא עמיד. ואפשר, כמו שעשו ב-NPR, להתייעץ עם מומחים, בעיקר אפידמיולוגים ומומחים לבריאות הציבור אבל בהחלט גם עם אנשים שיש להם מומחיות בתחומים אחרי שרלוונטיים לדיון.

דעתי האישית היא שאת חדרי הכושר יש לסגור. אנחנו בישראל ולא בנורבגיה, ואני לא מאמין שדווקא שם ישמרו על ההנחיות של ריחוק חברתי, היגיינה וחבישת מסיכות. אדרבא. כאן לדעתי יש להפעיל את עיקרון הזהירות המונעת. לגבי בריכות ומסעדות? אין לי מושג, מצטער.

מאחל לכולכם רק בריאות.

למה אין 180 חברי כנסת?

הנה שאלה שמישהו שאל בקבוצת "שאלה קטנה" בפייסבוק:

וגם ציוץ מטוויטר: ((כן, מישהו חסם אותי))

.

מה המשמעות של גודל הכנסת/פרלמנט

בפייסבוק מישהו ענה לשאלה בדבר מספר חברי הכנסת כי יש 120 חברי כנסת בגלל שזה היה מספר החברים בסנהדרין שפעל בימי בית שני, וזה נשמע לי הגיוני, למרות שלא מצאתי סימוכין לכך לא בויקיפדיה ולא באתר הכנסת. אבל זה לא עונה לחלק השני של השאלה. מאז קום המדינה האוכלוסייה גדלה בהרבה: מ-650 אלף בעת הכרזת המדינה לבערך מ-9 מיליון. יותר מפי 10. זה כמעט פי 14. אז אולי 120 חברי כנסת באמת לא מספיקים?

מצד שני, ראיתי גם טענות בעבר (( אין לי הפניות. אני מסתמך על זכרוני. )) לפיהן החזקה של 120 חברי כנסת זה בזבוז כסף עצום וצריך להקטין את מספר חברי הכנסת ל-70. אז כמה חברי כנסת באמת צריך? ומהן ההשלכות הפוליטיות הנגזרות מבחירה כזו או אחרת? (( אני נמנע בכוונה מדיון בהשלכות הכספיות במסגרת הפוסט. מי שמעוניין מוזמן לדון בכך בתגובות. ))

אני זוכר שדובי קננגיסר התייחס פעם לנושא בבלוג המצויין והלא פעיל שלו, אבל לא הצלחתי למצוא את הקישור. ההסבר שלו, וסלחו על אי הדיוקים, הוא שמדובר בעניין של ייצוג. בעת הקמת המדינה, כל חבר כנסת ייצג בערך 5400 אזרחים (( החישוב: 650000/120 )). כיום כל חבר כנסת מייצג 75000 אזרחים. אם היינו רוצים לשמור על אותה רמת ייצוג שהייתה בכנסת הראשונה ב-1949, היינו צריכים כמעט 1700 חברי כנסת. זה כמובן לא סביר.

דבר שני שצריך להתייחס אליו הוא הכח הפוליטי של כל חבר כנסת. כשיש 120 חברי כנסת, הכח הפוליטי של חבר כנסת בודד הוא 1/120, כלומר 0.83% מסך הכח הפוליטי. בכנסת של 180 חברים, הכם הפוליטי של כל חבר כנסת קטן יותר: 0.55%, ובכנסת של 70 חברים, הכח הפוליטי של חבר כנסת בודד גבוה באופן משמעותי: 1.4%. יש לכך השלכות כמובן: בכנסת קטנה של 70 חברים, אם חבר כנסת מחליט למשל לעזוב את מפלגתו ולחבור למפלגה אחרת, יש לכך הרבה יותר משמעות פוליטית בהשוואה לכנסת גדולה עם 180 חברים.

מכאן שלפרלמנט גדול יש שני יתרונות: הוא מאפשר ייצוג יותר טוב של תתי אוכלוסיות, בייחוד אם יש אחוז חסימה לא גבוה מדי או בחירות איזוריות. (( או שתיהן, כמו שנהוג למשל בגרמניה ))  נכון, זה כנראה יעלה יותר כסף, אבל אפשר לתמחר את זה, לפחות באופן עקרוני. מסיבה זו אני תומך בהגדלת מספר חברי הכנסת באופן משמעותי.

.

מה קורה בעולם?

עשיתי מחקר קטן. בדקתי מה קורה במדינות מערביות ודמוקרטיות שדומות לישראל מבחינת גודל האוכלוסייה. מדובר בכמה מדינות באירופה, כמה מדינות בארצות הברית, ובשלוש רפובליקות ברפובליקה הפדרלית של גרמניה. ברוב המדינות האלה יש שני בתים לפרלמנט ((כגון סנאט ובית הנבחרים במדינות ארצות הברית)), ובמקרים האלה לקחתי את נתוני הבית התחתון. הנתונים נמצאים כאן. גדלי האוכלוסייה מעוגלים פחות או יותר.

לכל מדינה חישבתי את כוחו הפוליטי של כל חבר פרלמנט כאחוז מסך מספר החברים בפרלמנט, ואת מספר התושבים המיוצגים על ידי כל חבר פרלמנט (בממוצע) על ידי חלוקת גודל האוכלוסייה במספר חברי הפרלמנט. נתונים אלה מוצגים בגרף הבא. חילקתי את המדינות לשלוש קבוצות על פי גודל האוכלוסייה, וצבעתי את הנקודות בהתאם. הנקודה של ישראל צבועה בכחול. (קוד R ליצירת הגרף נמצא כאן).

.

כצפוי אין הפתעות. גם הייצוגיות של האוכלוסייה וגם הכח הפוליטי של כל חבר פרלמנט תלויים במספר חברי הפרלמנט, ולכן הם הולכים ביחד. מקדם המתאם הוא 0.914.

מה שמעניין זו העובדה שהמתאם בין הכח הפוליטי ורמת הייצוגיות לא מושפע מגודל המדינה.  כאשר מחשבים את מקדמי המתאם לכל קבוצת מדינות בנפרד, כל השלושה גבוהים מ-0.97.

עובדה מעניינת נוספת היא שארבע המדינות בהן הייצוגיות נמוכה (כל חבר פרלמנט מייצג יותר ממאה אלף תושבים) או שהכח הפוליטי של כל חבר פרלמנט הוא לפחות אחוז אחד, הן מדינות בארצות הברית. שלוש המדינות בהן הייצוגיות גבוה והכח הפוליטי של כל חבר פרלמנט הוא פחות מחצי אחוז הן מדינות אירופאיות. אתם מוזמנים לדון במשמעות והסיבות של התוצאות האלה.

.

מה יכול לקרות בישראל

בדקתי שני תרחישים: תרחיש בו מספר חברי הכנסת מוגדל ל-180 או מוקטן ל-70. רמת הייצוגיות והכח הפוליטי של כל חבר כנסת במצב הנוכחי ובשני התרחישים מוצגים בטבלה הבאה:

מספר חברי כנסתכח פוליטירמת ייצוגיות
701.43%128500
1200.83%75000
1800.56%50000

.

חישבתי את מספר חברי הכנסת שהיו לכל סיעה בשתי הכנסות האחרונות בשני התרחישים (ללא שינויים בגובה אחוז החסימה) בשני התרחישים האלה, וכן את המפה הפוליטית בחלוקה לגושים. (( הותרתי את ישראל ביתנו מחוץ לגוש הימין ואת הרשימה המשותפת מחוץ לגוש המרכז/שמאל, למרות שמקומן אמור להיות בשני הגושים האלה, בהתאמה))

הנה, למשל, מפת הכנסת ה-22 אילו היו בה רק 70 חברים או 180 חברים: (( קוד R לחישובי המנדטים ))

מפלגה/גודל הכנסת12018070
כחול לבן334819
ליכוד324719
הרשימה המשותפת13197
שס9146
יהדות התורה8135
העבודה7114
המחנה הדמוקרטי7114
ישראל ביתנו693
ימינה583

.

אבל מה שמשנה זה כמובן הגוש. הנה מפת הגושים בכנסת ה-22: (( הותרתי את ישראל ביתנו מחוץ לגוש הימין ואת הרשימה המשותפת מחוץ לגוש המרכז/שמאל, למרות שמקומן אמור להיות בשני הגושים האלה, בהתאמה))

גוש/ גודל הכנסת12018070
ימין548233
מרכז477027
הרשימה המשותפת13197
ישראל ביתנו693

.

וזו מפת הגושים בכנסת ה-23: ((כן, אני יודע שגוש המרכז בכנסת הזו זה לא מה שהיה פעם))

גוש/ גודל הכנסת12018070
ימין588834
מרכז405923
הרשימה המשותפת15239
ישראל ביתנו7104

.

ושאלת השאלות: כמה מנדטים חסרים לגוש הימין כדי להשיג רוב בכנסת? התשובה בטבלה:

גודל הכנסתהרוב הדרושהכנסת ה-22הכנסת ה-23
1206173
1809193
703632

.

באופן לא מפתיע, בכנסת גדולה יותר חסרים לגוש הימין יותר קולות כדי להשיג רוב בכנסת. זה נכון גם עבור גוש המרכז כמובן. בכנסת ה-22 חסרו לגוש הזה 14 מנדטים כדי להשיג רוב, ואילו היו בכנסת 180 חברים היו חסרים לגוש זה 21 מנדטים.

כאשר תוצאות הבחירות צמודות ההבדל עשוי להיות משמעותי. אילו היו בכנסת הזו רק 70 חברי כנסת, אז גוש הימין היה צריך "להעביר" אליו רק 2 חברי כנסת מחוץ לגוש במקום שלושה. (( בסוף הם הצליחו להעביר כמעט 20, אבל זה סיפור אחר. )) לעומת זאת, אם היו בכנסת 180 חברים, המצב היה זהה מבחינת מספר הקולות החסרים לגוש הימין כדי להשיג רוב.

משפט הקופים

קוף מקבל כל פעם כדור ומניח אותו באחד משני סלים בהסתברויות שוות. בכל סל יש מקום לשני כדורים ואם סל מתמלא מרוקנים אותו מייד. כאשר יש בדיוק כדור אחד בכל סל, הקוף מקבל בננה. הוא מתחיל עם שני סלים ריקים. כמה כדורים יניח בממוצע עד שיקבל בננה?

אפשר לגשת לחידה הזו בכמה צורות.

הגישה ה-"נאיבית"

מי שלא בקיא בסטטיסטיקה והסתברות, יכול לחשוב על הגישה הבאה: ברור שאחרי כדור אחד הוא לא יקבל בננה. אחרי שני כדורים הוא יקבל בננה בהסתברות חצי, או שלא יקבל בננה ואז הוא יעמוד שוב בפני שני סלים ריקים. אם לא קיבל אחרי 2 כדורים, זה בגלל שהוא שם את שני הכדורים הראשונים באותו סל, ואז הוא ניצב שוב בפני שני סלים ריקים ולכן ברור כי הוא לא יקבל בננה אחרי הכדור השלישי. אבל הוא יכול לקבל בננה אחרי הכדור רביעי אם ישים את הכדור הרביעי בסל הריק. מה הסיכוי שנגיע עד לכאן? רבע, כי הסיכוי שהקוף יגיע לכדור השלישי הוא חצי, ומכאן כמו קודם יש לו סיכוי של חצי להגיע לבננה בעוד שני כדורים, וחצי של חצי זה רבע.

מכל הדיון הזה אפשר להסיק כי מספר הכדורים עד קבלת הבננה חייב להיות זוגי, וכן כי הסיכוי לקבלת בננה אחרי שני כדורים הוא חצי, אחרי ארבעה כדורים הסיכוי הוא רבע, אחרי שישה כדורים – שמינית, וכך הלאה.

אפשר לקרוא לגישה הזו בהרבה שמות, אבל נאיבית היא לא. לאלה שהגיעו עד לכאן – אנא קבלו את התנצלותי על כך שהטעיתי אתכם בכותרת. אני קורא לגישה הזו בשם "הגישה הנכונה". זה מה שצריך לעשות: למצוא את כל האפשרויות, ואת הסיכוי/הסתברות של כל אפשרות.

עכשיו רק צריך לשקלל את האפשרויות בהסתברויות שלהן. כלומר לחשב את זה:

זה דורש קצת אלגברה, ואני אדלג על החישוב ברשותכם. התוצאה היא 4.

גישה שניה: מציאת בעיה דומה

זו גישה מקובלת: אם עומדים בפני בעיה, מנסים למצוא בעיה דומה שכבר פתרנו, ובעזרת הפתרון הזה מגיעים לפתרון של הבעיה הנוכחית (( מכירים את הסיפור על המתמטיקאי והפיזיקאי שנתבקשו להרתיח מים בקומקום? ))

אפשר לנסח את הבעיה של הקוף באופן הבא: הוא מקבל שני כדורים, ושם כל אחד מהם בסל באופן אקראי. אם חילק אותם שווה בשווה בין שני הסלים, הוא מקבל בננה. אם לא – הוא יכול לנסות שוב.

כדי שהגישה הזו תעבוד צריך לשים לב לשני פרטים חשובים. קודם כל – שני הסלים שונים זה מזה. אני מניח שאף אחד לא יתווכח על זה. נקרא לסלים בשם הסל הימני והסל השמאלי.

הפרט השני בדרך כלל יותר בעייתי: גם שני הכדורים שונים זה מזה. אם כדור אחד היה אדום ואחד היה כחול, אז הטענה הזו הייתה ברורה לגמרי. אבל לפעמים קשה לשים לב להבדלים בין הכדורים. אולי ההבדלים הם רק בשריטות שיש על הכדורים. אפילו אם מדובר בשני כדורים חדשים מהניילון – הם עדיין שונים זה מזה. וגם אם הם זהים בכל פרט שאתם יכולים לדמיין – הם עדיין שונים זה מזה. אלה שני כדורים ולא כדור אחד. הם מורכבים מאטומים שונים. לכן נקרא לכדורים האלה בשם כדור א וכדור ב. מה יכול לקרות כשהקוף מקבל את שני הכדורים? יש ארבע אפשרויות

  • שני הכדורים בסל הימני
  • שני הכדורים בסל השמאלי
  • כדור א בסל הימני וכדור ב בסל השמאלי
  • כדור א בסל השמאלי וכדור ב בסל הימני

ומכיוון שהקוף בוחר באופן אקראי את הסל שבו יניח כל כדור, לכל ארבע האפשרויות האלה יש סיכוי שווה, והסיכוי הזה שווה לרבע. ומכיוון שבדיוק שתי אפשרויות שבהן הקוף יקבל בננה, הסיכוי שהוא יקבל בננה הוא חצי.

אז בעצם יכולנו להקל על הקוף ולתת לא להטיל מטבע. אם יצא פלי, מה חבל. אם יצא עץ, הקוף יכול לטפס על העץ ולקטוף לעצמו בננה.

וכך הפכנו את בעיית הקוף לבעיה שכולנו (( אני מקווה )) מכירים. כמה פעמים בממוצע צריך להטיל מטבע הוגן עד קבלת עץ? התשובה היא אחד חלקי הסיכוי לקבלת עץ, כלומר אחד חלקי חצי, כלומר 2. אבל רגע, בכל "הטלת מטבע" כזו הקוף מקבל 2 כדורים, ולכן מספר הכדורים הוא 2 כפול 2, כלומר 4, אותה התשובה שקיבלנו קודם.

גישה שלישית: שרשרת מרקוב – לא להיבהל!

דיברתי כבר על שרשראות מרקוב כאשר דנתי בבעיית המטריות. שאלת הקוף היא עוד דוגמא נחמדה לשרשרת מרקוב.

ניזכר: שרשרת מרקוב היא קבוצה של מצבים, בצירוף ההסתברות לעבור ממצב למצב.

לשרשרת של הקוף יש שלושה מצבים:

  1. שני סלים ריקים. נסמן מצב זה ב-00.
  2. סל אחד ריק ובשני יש כדור. נסמן מצב זה ב-01.
  3. כדור אחד בכל סל. נסמן מצב זה ב-11.

אם הקוף במצב 00 הוא יכול לעבור רק למצב 01. יש שני סלים ריקים, הוא מקבל כדור ושם אותו באחד הסלים. זה כל מה שאפשר. ההסתברות לעבור ממצב 00 למצב 01 שווה ל-1.

אם הקוף במצב 01 יכולים לקרות שני דברים: או שהוא שם את הכדור הבא בסל שכבר יש בו כדור. בסל יש שני כדורים, מרוקנים אותו, והקוף חוזר למצב 00. זה קורה בהסתברות חצי. הדבר השני שיכול לקרות הוא שהקוף ישים את הכדור בסל הריק, יגיע למצב 11, יקבל בננה, והמשחק נגמר. גם זה יכול לקרות בהסתברות חצי.

אם הקוף במצב 11 הוא כבר לא מתעניין בנו, כי יש לו בננה. ההסתברות לעבור ממצב 11 למצב 00 או 01 היא 0. המצב הבא, אם נתעקש, יהיה שוב 11. כלומר, ממצב 11 עוברים למצב 11 בהסתברות 1.

הנה תיאור ציורי של השרשרת:

הקוף למעשה מטייל לו בין מצבים 00 ל-01 עד שבמקרה הוא מצליח לעבור למצב 11. בעזרת הציור קל לראות שמספר הכדורים שהקוף יניח עד קבלת הבננה הוא זוגי.

איך כל זה עוזר לנו?

נניח שממוצע מספר הצעדים/כדורים מ-00 ל-11 הוא X.

כפי שראינו קודם, X שווה ל-2 בהסתברות 0.5.

אבל אם בשני הצעדים הראשונים שלו הקוף יצא מ-00 וגם חזר לשם, אז ממוצע מספר הצעדים שנותרו לו מעכשיו הוא גם כן X! וזאת מכיוון שמצבו עכשיו, לאחר שני צעדים לא שונה מהמצב ההתחלתי. כלומר, ממוצע מספר הצעדים אם אנחנו יודעים שהוא כבר עשה סיבוב אחד של 00 ל-01 ל-00 הוא 2+X. ההסתברות שזה יקרה גם כן שווה לחצי. ולכן

פתרון המשוואה הזו הוא X=4.

משפט הקופים

המסקנה מתוך כל הדיון הזה: אם תתנו לקוף לתקתק מספיק זמן על מכונת כתיבה הוא ידפיס את כל כתבי שייקספיר.

רגע? מה?

בואו נחזור לבעיה המקורית, זאת עם הכדורים והבננה. מה הסיכוי שהקוף יטייל במשך כל חייו האינסופיים בין המצבים 00 ו-01?

קודם ראינו כי הסיכוי שהוא יגיע לבננה אחרי 2 צעדים הוא חצי, אחרי 4 צעדים – רבע, אחרי 6 צעדים – שמינית, וכך עד אינסוף. לכן הסיכוי שהוא יקבל בננה שווה לחצי ועוד רבע ועוד שמינית וכן הלאה. זהו סכום של טור גיאומטרי אינסופי, והסכום הזה שווה ל-1. ההסתברות שהקוף יקבל בננה היא 1.

עכשיו, בואו נרחם על הקוף שלנו, ולפני שנטיל עליו להדפיס את כל כתבי שייקספיר נבקש ממנו לתקתק את המילה "יוסי". הקוף נמצא בעצם בשרשרת מרקוב בת שני מצבים. במצב אחד יש לו דף נייר חלק, ובמצב השני יש דף שעליו מתנוסס השם שלי.

הקוף מקבל דף חלק. זהו מצב 0. הוא מתקתק ארבע אותיות ובא אלי להראות לי מה הוא הצליח לעשות. אם כתוב "יוסי" אני נותן לו חיזוק חיובי ומשחרר אותו עד מחר. הוא הגיע למצב 1. אם לא, אני מקמט את הנייר, זורק לפח, ונותן לו דף נייר חדש, שינסה שוב, עד שיעשה את זה כמו שצריך.

זה כמו הטלת מטבע, רק שהסיכוי להטלת עץ הוא מאוד קטן. אבל לא אפס. נסמן את הסיכוי הזה באות p. הקוף מתחיל במצב 0, עובר למצב 1 בהסתברות p ונשאר במצב 0 בהסתברות p-1. אם הוא מגיע למצב 1 הוא נשאר שם בהסתברות 1.

כמו קודם, אם הוא יטיל את המטבע שוב ושוב בסוף יתקבל עץ. אפשר לחשב כמו קודם סכום של טור גיאומטרי אינסופי ולראות כי ההסתברות לקבל עץ או לתקתק את כל כתבי שייקספיר שווה ל-1. הקוף יצטרך בממוצע 1/p ניסיונות. כל מה שאתם צריכים זה לחכות.

איך מחשבים את אחוזי התמותה?

מאז התפרצות מגיפת הקורונה נזרקים לאוויר המון נתונים על אחוזי התמותה מהמחלה. אייך מחשבים את האחוזים האלה? לכאורה זה מאוד פשוט: לוקחים את מספר המתים ומחלקים אותו ב-… במה בדיוק? אנסה לעשות קצת סדר.

אציין כי לא אתייחס במפורש ליתרונות, החסרונות, המשמעות והפרשנות של כל מדד, אלא רק כאשר אראה צורך בכך. אתם מוזמנים לקיים דיון ולשאול שאלות בתגובות כאן או בקבוצת הפייסבוק "חפירות על סטטיסטיקה".

עדכון (15.4.2020): לאחר שקראתי חלק מהתגובות כאן ובדף הפייסבוק של נסיכת המדעים, אני רוצה להבהיר שאין כאן שום כוונה או ניסיון להסביר את המצב הנוכחי של המגיפה. המטרה היא רק להסביר את אופן חישוב המדדים השונים. הדוגמאות שכאן מייחסות לנתונים של האוכלוסייה הכללית, ויש להבהיר כי תמונת המצב האמיתית תלויה בעוד הרבה גורמים והפוסט הזה נמנע מלהתייחס אליהם.

מהו מספר מקרי המוות?

נתחיל במונה, כלומר במספר המתים. בדרך כלל מופיע שם מספר מקרי המוות המאומתים – confirmed deaths. זהו מספר האנשים שאובחנו כחולי קורונה ומתו סמוך לזמן האבחון. לרוב זהו מספר האנשים שמתו לאחר האבחון, אם כי תיאורטית ניתן לבדוק לאחר המוות אם המנוח היה חולה.

יש אנשים הטוענים כי לא צריך להביא במניין המתים אנשים שהיו מתים "ממילא", כמו אנשים עם מחלות רקע או אנשים בגיל מופלג. אני חושב זה לא נכון. שיעור מקרי המוות בקרב חולי קורונה שהינם חולי סכרת או מחלות אחרות כגון מחלות לב, לחץ דם גבוה ומחלות דומות אכן גבוה יותר משיעור מקרי המוות באוכלוסייה הכללית, כמו גם בקרב אנשים מבוגרים – שיעור מקרי המוות עולה עם הגיל. אבל אנשים יכולים לחיות שנים רבות עם מחלות רקע כאשר הם מקבלים טיפול רפואי מתאים, ולכן לדעתי לא צריך לגרוע אותם ממספר המתים.

גם לגבי אנשים מבוגרים – הם לא היו "מתים ממילא" עקב גילם. תוחלת החיים של גברים בישראל היא בערך 80 שנה (( זה כמובן תלוי מין, מגזר וגורמים נוספים, כגון הרגלי עישון )). אבל למי שהגיע לגיל 80 לא נותרו בממוצע אפס שנות חיים אלא הרבה יותר. אם תבדקו בנתוני הלמ"ס, תראו כי תוחלת שארית החיים של גבר שהגיע לגיל 80 היא 8.9 שנים (קישור לקובץ pdf). אם תחשבו על זה קצת תראו שזה הגיוני לגמרי: כל מי שהגיע לגיל 80 מת אחרי גיל 80, ולכן גיל המוות הממוצע של האנשים שהגיעו לגיל 80 בהכרח גבוה מ-80. (( אני לא אדון כאן באופן חישוב תוחלת החיים ))

הבעיה השניה בחישוב מספר המתים עקב תחלואה בקורונה היא שכאמור – נספרים רק אנשים שאובחנו כחולים. סביר להניח שיש עוד אנשים שמתו עקב תחלואה בקורונה אך לא אובחנו כחולים באופן "רשמי", כלומר הם לא confirmed. כמה אנשים כאלה יש? אף אחד לא יודע. בכל מקרה, מספר המתים מקורונה אינו קטן ממספר ה- confirmed deaths, וסביר להניח שהוא יותר גבוה.

נעבור למכנה: יש לנו את מספר מקרי המוות – במה מחלקים אותו? כאן יש מספר אפשרויות.

חישוב שיעור התמותה הבסיסי

המדד הבסיסי ביותר הוא פשוט "שיעור התמותה", ה-mortality rate שמכונה לפעמים בשם crude mortality rate. זהו מספר המתים, בתקופת זמן מסויימת, מתוך כלל האוכלוסייה, כולל אלה שלא חולים או לא אובחנו כחולים. מדד זה מצלם תמונת מצב. ניקח דוגמה. בעת כתיבת שורות אלה, יש בישראל 103 מתים עקב חולי בקורונה בחודשיים האחרונים. האוכלוסייה בישראל היא בערך 9 מיליון איש. אז מחלקים 100 ב-9000000 ומקבלים 0.001% או, כפי שמקובל בקרב האפידמיולוגים, שיעור תמותה של 1.1 אנשים ל-100,000 בחודשיים האחרונים (( אני מעגל את כל המספרים לצורך ההדגמות )). עד כמה המדד הזה משקף את המציאות? זה תלוי כמובן בגודל המדגם, שבמקרה שלנו הוא משך הזמן בו מתבצעת המדידה. הדבר דומה במובן מסויים להערכת רמת הבטיחות של רכבים אוטונומיים.

מדדים המתייחסים לאוכלוסייה החולה

מדדים יותר רלוונטיים מתייחסים לאוכלוסייה החולה. לדוגמה, שיעור התמותה עקב סרטן הלבלב באוכלוסייה הכללית הוא נמוך כיוון שזו מחלה נדירה יחסית. אבל בקרב החולים, שיעור התמותה הוא מאוד גבוה (והוא תלוי כמובן בתקופת הזמן אליה מתייחסים, שיכולה להיות חודש מאז האבחון או שנה ממועד האבחון או כל תקופת זמן אחרת).

Case fatality rate

מדד אחד שמתייחס למספר החולים המאומתים הוא ה- case fatality rate או בקיצור CFR. (( אין לי מושג איך זה מתורגם לעברית )). כאן לוקחים את מספר המתים המאומתים, ומחלקים אותו במספר החולים המאומתים. בעת כתיבת שורות אלה, יש בישראל קצת יותר מ-11000 חולים מאומתים. נחלק 100 ב-11000 ונקבל 0.9%, או 909 ל-100000. ((ההצגה של מספר מקרים ל-100000 היא קצת בעייתית במקרה הזה, כי לפחות כרגע יש רק 100 מתים. זה קצת דומה לחישוב מספר האפיפיורים לקמ"ר בוותיקן, ששטחו רק כחצי קמ"ר. )). הבעיות? כפי שציינו קודם, מספר מקרי המוות גדול ממספר מקרי המוות המאומתים. לפי אותו הגיון, גם מספר החולים בפועל גדול ממספר החולים המאומתים. שלישית, במדד זה גם חולים אסימפטומטיים נכנסים למכנה. אלה הם האנשים שנדבקו ווירוס ולא פיתחו סימפטומים קליניים של המחלה.

Infection fatality rate

אם אתם חושבים שחולים אסימפטומטיים אינם צריכים להילקח בחשבון אלא רק חולים עם תסמינים, המדד שמעניין אתכם הוא ה-infection fatality rate, או בקיצור IFR. כאן מחלקים את מספר מקרי המוות במספר החולים שפיתחו תסמינים קליניים. למיטב הבנתי, הנתון של 11000 חולים מאומתים בישראל כולל גם חולים אסימפטומטיים. ההערכה משלי מבוססת על נתוני החולים לפי מצבם:  קל, בינוני, קשה ומונשם. חיברתי את המספרים וקיבלתי קצת יותר מ-9500. נכון לעכשיו ה-IFR הוא בערך 100 חלקי 9500, כלומר קצת יותר מאחוז.

הסיכון למות

למדדי ה-CFR וה-IFR יש משמעות ותועלת במעקב אחרי הדינמיקה של המגיפה. ה-"בעיה" במדדים אלה היא שלמרבה השמחה רוב החולים לא ימותו. לכן מדדים זה אינם הסיכון של חולה במחלה למות. וזה מה שבאמת מעניין את מי שחולה, או מי שהסיכון הזה טורד את מנוחתו, ועם יד הלב, יש כאן מישהו שלא מוטרד מזה?

לפי הנתונים העכשוויים של האתר worldometers, יש כרגע בעולם כ-1.8 מיליון חולים. מה יהיה גורלם? אנחנו לא יודעים עדיין מה יהיה הגורל של רובם. אבל אנחנו כן יודעים מה עלה בגורלם של כ-549 אלף חולים המהווים כ-30% מסך החולים:  כ-115 אלף מחולים אלה מתו, וכ-434 אלף חולים הבריאו. 115 מתוך 549 הם 21%. זהו הסיכון של חולה למות. אם לא לוקחים את החולים שבסין בחשבון, הסיכון למות הוא 23%. אם מישהו בעולם שמחוץ לסין חולה בקורונה, ואנחנו לא יודעים פרטים נוספים אודותיו, אז הסיכון שלו למות הוא 23%, וזה הרבה מאוד. זאת כמובן, בתנאי שה-549 אלף שמהלך המחלה שלהם הסתיים בהבראה או מוות מייצגים את שאר 1.3 מיליון החולים שמהלך המחלה שלהם לא הסתיים. אני חושב שהם כן מייצגים. אני עוקב אחרי הנתונים האלה כמעט שלושה שבועות, והיחסים נשארים קבועים כאשר מספר החולים הכולל, מספר המתים ומספר המחלימים גדל. אחוז המתים מתוך החולים שמהלך המחלה שלהם הסתיים במשך הזמן הזה הוא קצת יותר מ-20%.

מה הסיכון למות בישראל?

אני מודה שלא עקבתי אחרי הנתונים האלה בישראל לאורך זמן, אבל אני כן יודע את תמונת המצב הנוכחית: נכון למועד כתיבת שורות אלה, 103 מתו ו-1627 החלימו. כלומר אנחנו יודעים מה עלה בגורלם של 1730 חולים. 103 מתוך 1730 זה כמעט 6%. מצבנו טוב ביחס לעולם, לפחות כרגע. זה גם מדגם קטן יחסית. מוקדם לקבוע.

הסקה סיבתית ומציאות חלופית

גישת "המציאות החילופית" שגובשה על ידי דונלד רובין באמצע שנות השבעים היא אחת משתי הגישות המובילות היום בתחום של הסקה סיבתית. הביטוי "מציאות חלופית" הוא התרגום שלי למונח counterfactual, שמקורו בגישה של דייויד יום שסקרתי בפוסט הראשון בסדרה. כזכור, יום טען כי יש להסיק סיבתיות על ידי השוואת מה שקרה בפועל למה שהיה עשוי לקרות אילו הייתה ננקטת פעולה אחרת מזו שננקטה. עקב כך, טען יום, אי אפשר לקבוע אפקט סיבתי, כי אנחנו לעולם יכולים לצפות במה שהיה קורה אילו. יום צודק כמובן. אבל, האם אפשר לעקוף את הבעיה?

רובין הסתייג מהשימוש במילה counterfactual, ומעדיף את הביטוי potential outcome או "תוצאה פוטנציאלית" בעברית. הסיבה לכך, מסביר רובין, היא שיש  counterfactuals שלא ניתן לצפות בהם,  אפילו לא באופן תיאורטי. הדוגמה שלו היא כי אין שום אפשרות תיאורטית לצפות בגובה שלך בגיל 3 אילו נולדת בקוטב הצפוני. לעומת זאת, אם מדובר בשני טיפולים אפשריים למחלה כלשהי, יש מראש אפשרות לצפות בשתי התוצאות: תוצאה אחת אם החולה יקבל טיפול אחד, תוצאה אחרת אם החולה יקבל את הטיפול השני, ואנחנו (( כלומר הרופא בהתייעצות עם החולה )) יכולים להחליט באיזו תוצאה אנחנו רוצים לצפות. אתם יכולים להחליט לצפות בגובה של עצמכם בגיל 3 אילו נולדתם בקוטב הצפוני עד מחר. יש אולי יקום מקביל שבו זה קורה, אבל אין שום אפשרות לצפות בו. (( לאיש שיושב באמצע השורה הראשונה, נע בחוסר נוחות בכיסא שלו ומצביע כי הוא רוצה לשאול שאלה: אני תיכף אחזור לזה ))

אתן כאן סקירה מאוד קצרה של ההיסטוריה של גישת התוצאה הפוטנציאלית. באופן לא מפתיע, הראשונים שהעלו את הרעיון בהקשר סטטיסטי היו רונלד פישר וג'רזי ניימן. פישר העלה את הרעיון בקצרה במאמר שהופיע ב-1918. הוא דן ברעיון הזה גם בספריו המשפיעים על שיטות מחקר ותכנון ניסויים שיצאו לאור בשנות העשרים של המאה הקודמת. אולם, כפי שרובין הדגיש כאשר נשא את ההרצאה השנתית של שם פישר ב-2004, הרעיון שהעלה פישר לא הבשיל לפורמולציה מתמטית. האדם הראשון שהציע תיאוריה מתמטית של תוצאות פוטנציאליות בהקשר של הסקה סטטיסטית היה ניימן, בעבודת הדוקטורט שלו מ-1923, שנכתבה בפולנית. (( סביר להניח שניימן לא הכיר את המאמר של פישר מ-1918 )) רובין הרחיב את העבודה של ניימן, ומתווה זה מכונה היום בשם Neyman-Runbin Framework, מונח שטבע יהודה פרל, ולעיתים רק בשם מודל הסיבתיות של רובין.

בואו נחזור לאדם שנולד אולי בקוטב הצפוני. אנחנו אולי יכולים לקחת קבוצה של אנשים שנולדו בקוטב הצפוני ולהשוות אותה לקבוצה של אנשים שנולדו במקום אחר, אבל האם נוכל להסיק מכך על סיבתיות כלשהי? התשובה היא לא, לפחות לא על פי מתווה ניימן-רובין. האנשים שנולדו בקוטב הצפוני שונים באופן מהותי מאלה שנולדו באפריקה, למשל.

ניזכר בסטנדרט הזהב להוכחת סיבתיות: ניסוי מבוקר בהקצאה רנדומלית. אם אנחנו רוצים לבדוק האם תרופה כלשהי גורמת לשיפור במצבו של חולה, אנחנו יכולים לערוך ניסוי קליני כדי לבדוק את זה. אם נמצא כי מצבם של החולים שטופלו היה בסופו של דבר יותר טוב ממצבם של החולים שלא טופלו והיוו את קבוצת הביקורת, נוכל להסיק כי התרופה גרמה לשיפור הזה.

מה בדבר מכשירי האידוי לטבק? האם אנחנו יכולים לבצע ניסוי קליני מבוקר בהקצאה רנדומלית כדי לבדוק את ההשפעות הבריאותיות של המכשירים הלאה? אנחנו לא יכולים לעשות את זה, אבל הסיבות לכך הן אתיות, לא יישומיות. סביר להניח שאפשר לערוך ניסוי כזה בצפון קוריאה, אם השלטונות שם יחליטו שזה מעניין אותם.

ומה ההשפעה של מקום הלידה על הגובה של אדם? או ההשפעה של המין הביולוגי של אדם על משהו שמעניין אותנו? אפילו קים ג'ונג און לא יכול לקחת קבוצה של אנשים, ולהקצות למחציתם כרומוזום Y באופן רנדומלי.

בבסיס מתווה ניימן-רובין נמצאת הטענה/אקסיומה שאין סיבתיות ללא התערבות: No causation without manipulation. ההתערבות היא שמאפשרת לנו את היכולת לצפות בתוצאה פוטנציאלית, ואנחנו יכולים להחליט באיזו תוצאה לצפות על ידי ההתערבות שבה ננקוט. אם אנחנו לא יכולים להתערב ולשנות את הגורם שחשוד כגורם סיבתי, אנחנו לא יכולים להחליט באיזה תוצאה פוטנציאלית אנחנו רוצים לצפות. רובין תיאר את זה יפה בהרצאה שנתן כאשר ביקר בארץ לפני כמה שנים: כאשר יש לכם נתונים תצפיתיים ואתם רוצים לבדוק האם גורם כלשהו, עישון למשל, הוא גורם סיבתי, בררו קודם כל אם הייתם יכולים לערוך ניסוי מבוקר בהקצאה רנדומלית כדי לבדוק את זה, אילו הייתם דיקטטורים כל יכולים. אם לא, אין טעם  להמשיך הלאה.

כאן רק מתחילות הבעיות.

ניימן ורובין קובעים כי אפקט הוא סיבתי אם התוצאות הפוטנציאליות שונות זו מזו. לדוגמה, אם חולה מבריא אחרי שקיבל את התרופה, ומת אם הוא לא קיבל אותה, אז אנחנו יכולים להסיק כי התרופה גרמה להחלמת החולה.

אבל, אל תשכחו את דייויד יום. גם אם אפשר להתערב ולהחליט באיזו תוצאה פוטנציאלית רוצים לצפות, אנחנו יכולים לצפות רק בתוצאה פוטנציאלית אחת. או שאנחנו נותנים לחולה את התרופה, ואז רואים מה קרה לו לאחר שהוא לקח אותה, או שאנחנו לא נותנים לו אותה ואז אנחנו רואים  מה קורה לו כשהוא לא מקבל את התרופה. אי אפשר גם וגם. זוהי הבעיה היסודית של ההסקה הסיבתיתThe fundamental problem of causal inference, מונח שטבע פול הולנד ב-1986. אנחנו לא יכולים לצפות באפקט הסיבתי של גורם על אדם.

מה שאנחנו כן יכולים לעשות זה לנסות לצפות באפקט הממוצע באוכלוסייה מסויימת. יש לזה מחיר, או מחירים, שצריך לשלם. הולנד מביא כמה דוגמאות מעניינות במאמר שלו מ-1986. למעשה, בכל פעם שאנחנו מסיקים מסקנה סיבתית כלשהי, כגון "אם לא תלבש סוודר אתה תצטנן", אנחנו מניחים משהו באופן לא מודע, כדי לעקוף את המחסום של יום. בפוסט הבא בסדרה אסקור את ההנחות המקובלות בהסקה סיבתית מתוך מחקרים תצפיתיים.

מקורות

Statistics and Causal Inference – Paul W. Holland, 1986

Causal Inference Using Potential Outcomes: Design, Modeling, Decisions – Donald B. Rubin, 2005

הפוסטים הקודמים בסדרה

17 משוואות ששינו את העולם

לפני כשנה קראתי את הספר "17 משוואות ששינו את העולם" מאת איאן סטיוארט, וכתבתי את רשמיי בסדרת ציוצים בטוויטר. פוסט זה מבוסס על סדרת הציוצים ההיא וסוקר את שבעת הפרקים הראשונים של הספר. למה רק שבעה? התשובה בסוף הפוסט.

לפני הכל, כמה מילים על המחבר. בשתי מילים: . סטיוארט הוא פרופסור למתמטיקה באוניברסיטת וורוויק באנגליה. הוא כתב הרבה ספרים העוסקים במתמטיקה שמיועדים לקהל הרחב, ואני מברך אותו על כך. קראתי מספר ספרים שהוא כתב, והם נמצאים על מדפי הספרייה שלי. הוא יודע מתמטיקה, והרבה, אין ספק. גם בפיזיקה הוא לא קוטל קנים. אבל לדעתי יש לו בעיה ככותב. הוא טרחן ונסחף בקלות. הוא רוצה לספר סיפורים, וזה מצויין, אבל לעיתים הוא סוטה מהנושא, ו/או נכנס לדיונים טכניים מיותרים. בספר הזה יש עוד בעיות, לדעתי לפחות.

הפרק הראשון של הספר עוסק ב.  סטיוארט  מסביר כמובן מה המשפט אומר ומסביר מה השימושים שלו. זה אכן משפט מאוד שימושי, וסטיוארט מפרט את ההתפתחות בשימושים שלו לאורך השנים. סטיוארט גם סוקר את ההיסטוריה של המשפט, שהיה מוכר עוד הרבה לפני תקופתו של .

הוא מנצל את ההזדמנות לדון גם ובגאומטריה שפיתח, ואז מתחילות הבעיות. כאשר הדיון הגיע אל האקסיומה החמישית של אוקלידס, הלא היא . סטיוארט לא מצליח להסביר באופן בהיר מהי המשמעות שלה, אלא נתפס לניסוח המסורבל של אוקלידס. הוא מציין כי לא ניתן להוכיח את האקסיומה מתוך האקסיומות שקדמו לה, וזה נכון, אבל שוכח משום מה להזכיר כי גם לא ניתן לסתור אותה, וזה כל העניין כאן. העובדה שהאקסיומה בלתי תלויה באקסיומות האחרות היא מה שמאפשרת את החלפתה באקסיומה אחרת. זה שלא מצליחים להוכיח משהו לא מספיק כדי להצדיק את זניחתו. מכיוון שלא הבהיר כהלכה את הנקודה הזו הוא גם לא נותן קרדיט לניקולאי לובצ'בסקי שהוכיח את אי תלות האקסיומה באקסיומות הקודמות. ברנרד רימן ופועלו, לעומת זאת, זוכים אצלו לתיאור נרחב, אבל כאן הפרק מתדרדר. ההסברים שלו הופכים להיות יותר ויותר טכניים. אני לא יכול להעיד על כל ציבור הקוראים, אבל אני באופן אישי נשברתי ודילגתי על כל הקטעים האלה והמשכתי לפרק הבא.

מה חסר לי בפרק הזה? לפיתגורס ולכת המתמטיקאים שלו הייתה בעיה קטנה: אם יש משולש ישר זווית שאורכי הניצבים שלו שווים שניהם ל-1, אז אורך היתר צריך להיות שווה לשורש של 2. השורש של 2 הוא , ופיתגורס סירב להכיר בקיומם של מספרים כאלה. אני לא זוכר את כל פרטי ההתמודדות של פיתגורס וחבריו עם המציאות הלא נעימה הזו, אבל האגדה מספרת כי הם הוציאו להורג את האיש שהוכיח כי השורש של 2 הוא מספר אי רציונלי. לדעתי היה מקום לדון כאן בעניין הפעוט הזה, אבל אולי יהיה מקום לדון בזה בהמשך הספר.

הפרק השני, העוסק , כתוב היטב. המשוואה/נוסחה היא שהלוג של a כפול  b שווה ללוג של a ועוד הלוג של b. לא להיבהל. סטיוארט מסביר כי הרעיון הוא שיש דרך להפוך פעולת כפל, שהינה מסובכת יחסית, לפעולת חיבור, שהיא קלה יותר לביצוע. אתם מוזמנים להיווכח בעצמכם: נסו להכפיל 24 ב-12 בלי מחשבון, רק עם נייר ועיפרון, ואחר כך תנסו לחבר את שני המספרים האלה.

סטיוארט סוקר את ההיסטוריה של הרעיון, שהגה המתמטיקאי החובב , ושופצר על ידי המתמטיקאי הנרי בריגס. אחר כך הוא מסביר את הרעיון בצורה מאוד בהירה. הוא ממשיך בתיאור של סרגלי החישוב , שהם יישום מכני של עקרון הלוגריתמים, שהיו נפוצים כמעט עד סוף המאה הקודמת ((ניתן לראות את תפקידם החשוב של הסרגלים האלה באחת הסצינות הדרמטיות של הסרט "אפולו 13" )) , וזה תיאור קצת טכני מדי לטעמי. הוא מסיים בשני שימושים עדכניים לפונקציית הלוגריתם. הראשון הוא חישובי דעיכה רדיואקטיבית בהקשר של תאונת הכור הגרעיני בפוקושימה (כתוב היטב). היישום השני, מדידת עוצמת הקול/צליל/רעש, על ידי סולם הדציבל, כתוב באופן קצת מסורבל לטעמי.

מה היה חסר לי בפרק הזה? ובכן, אני לא יודע איך המחשבים/מחשבונים של ימינו מבצעים פעולות כפל. מהו האלגוריתם? האם האלגוריתם משתמש בלוגריתם? אני חושב שזה היה יכול לעניין את הקוראים.

הנוסחה של הפרק השלישי היא נוסחת הגדרת הנגזרת. כצפוי, סטיוארט נותן תיאור של ההיסטוריה הלא כל כך ארוכה של מושג הנגזרת, ומזכיר, בין היתר את ואת . הוא מסביר באופן יפה את הרעיון על ידי הדגמה של בעיית חישוב המהירות הרגעית של גוף, שהייתה גם הבעיה שנתנה את המוטיבציה לפיתוח התיאוריה. הוא עובר מכאן לתיאור נרחב של בעיית התנועה וסוקר את הגישות אליה, החל מאריסטו ועד ניוטון, כמובן. הוא מסביר באופן מתקבל על הדעת את שלושת חוקי התנועה של ניוטון, באופן פחות מתקבל על הדעת כיצד בעזרת חוקים אלה ניתן לחשב את מהירותו של גוף על ידי מהירותו ההתחלתית, התאוצה שלו והזמן שעבר – זו לא גזירה אלא אינטגרציה, ואחר כך מסתבך לגמרי בניסיון להסביר מה זה תנע. תוך כדי כך הוא גם משחיל דיון קטן על גרביטציה. בנוסף, הוא דן גם במושג האנרגיה. הוא גם מתייחס ללייבניץ, שכידוע פיתח את החשבון הדיפרנציאלי באופן בלתי תלוי ובערך באותו זמן כמו ניוטון. סטיוארט, אנגלי, טוען שניוטון זכאי לקרדיט גדול יותר מכיוון שהוא פיתח את הרעיון בקונטקסט פיזיקלי, בעוד שהקונטקסט של לייבניץ היה יותר "מתמטי טהור", whatever it means.

סטיוארט לא מתעלם מהפיל הגדול שבחדר, עליו הצביע כבר בימי ניוטון הארכיבישוף ברקלי (( הקשר לאוניבסיטת ברקלי אינו מקרי כלל וכלל. האוניברסיטה והעיר בה היא שוכנת נקראות על שמו )) . במתמטיקה של ניוטון, וגם בזו של לייבניץ, יש כשל לוגי חמור. אסביר: בנוסחאות מתמטיות, אותיות מסמלות מספרים. אחת האותיות בסימון של ניוטון היא האות o. ניוטון, וגם לייבניץ, מניחים במפורש כי o חייב שונה מאפס (( לא לבלבל בין o ובין 0 ! )).  כדי ליישם את הנוסחה, יש צורך לבצע כל מיני מניפולציות אלגבריות: חיבור, חיסור, כפל, וחילוק. בפרט, בשלב מסויים חייבים לחלק ב-o, וזה בסדר גמור כי כזכור  o שונה מאפס. בסוף מקבלים משהו שכולל בתוכו את o, ואז ניוטון, ולייבניץ אומרים משהו כמו "עכשיו o יהיה שווה לאפס". זה לא הולך ככה. אי אפשר שמשהו יהיה שונה מאפס כשזה מתאים לך ואחר יהיה בכל זאת שווה לאפס כי הנסיבות השתנו ועכשיו זה יותר מתאים לך. את הכשל הלוגי הזה התחילו ליישב רק לקראת סוף המאה ה-18, כאשר המתמטיקאי הצרפתי הציג את מושג הגבול. סטיוארט נכשל לחלוטין בניסיון להסביר את מושג הגבול, אבל אני לא מאשים אותו. זה קשה.

מה עוד? סטיוארט מתאר כמה יישומים נוספים של מושג הנגזרת, אבל הוא מתעלם מהשימוש העיקרי: אופטימיזציה, כלומר מציאת נקודות מינימום או מקסימום של פונקציה. הנגזרת מאפשרת למצוא את הנקודות האלה גם באופן ישיר וגם באופן עקיף על ידי חישוב נומרי (בשיטות כמו ניוטון-רפסון,gragient decent  ודומותיהן). לשיטות האלה יש שימוש מרכזי בסטטיסטיקה ובתחום הבינה המלאכותית.

מי חסר בפרק הזה? . אני לא מבין איך אפשר לדון כל כך הרבה בחוקי התנועה של ניוטון ולהתייחס אליהם כנקודה האחרונה בתהליך המחשבתי שנמשך דורות. התהליך המשיך גם אחרי ניוטון. לאיינשטיין היה חלק מכריע בהרחבת התיאוריה של ניוטון. אי אפשר להתעלם ממנו. אבל סטיוארט התעלם.

הפרק הרביעי של הספר עוסק בחוק הכבידה של ניוטון. במילים מאוד לא מדוייקת, החוק אומר כי כח המשיכה של גופים גדול יותר ככל שהמסה שלהם גדולה יותר, וההשפעה של כח המשיכה הולכת ונחלשת ככל שמתרחקים מהגוף המושך. מחבריי הפיזיקאים אני מבקש סליחה, אבל התיאור הזה מתאים לצרכי הטוויטר.

סטיוארט לא מדבר יותר מדי על המשוואה עצמה. הוא מביא סקירה היסטורית רחבה של תפיסת מבנה היקום, החל מהבבלים, דרך תלמי, כל הדרך עד לקפלר. הוא מתאר את סיפור התפוח המפורסם שנפל על ראשו של ניוטון כאשר נח תחת עץ (האמת היא שזה לא קרא באמת אלא שניוטון השתמש המטאפורה הזו כדי להסביר חלק מהרעיון). סטיוארט גם מדגיש כי חוק הכבידה הוא אוניברסלי – המשיכה קיימת בין כל שני גופים ביקום, וזו נקודה חשובה. מה עוד? הוא מתאר באריכות את המחלוקת בין ניוטון בעניין הקרדיט לגילוי חוק הכבידה. הוק כנראה ידע את זה לפני ניוטון, אבל ניוטון נתן את הניסוח המתמטי המדוייק, וגם נתן קרדיט להוק על התרומה שלו בספרו, ולכן הקרדיט המלא אכן מגיע לניוטון. סטיוארט מסביר בקצרה את המשמעות של חוק הכבידה בחישובי מסלולים של חלליות ולוויינים, ועובר לדיון ארוך ומייגע בתיאוריה/ספקולציה של חורי התולעת.

נחמד, אבל כאן יש לי כמה הערות: ראשית, סטיוארט כותב כי החוק מדגים את היכולת של המתמטיקה למצוא תבניות נסתרות ביקום ולגלות פשטות החבויה במורכבות של היקום. אני לא כל כך מסכים עם האמירה הזו. החוק של ניוטון הוא לדעתי מודל פשוט מאוד של היקום שנגזר מתוך תצפיות. אין עוררין על כך שהמודל הזה הוא ציון דרך סופר חשוב במדע, אבל התצפיות על היקום הובילו לתיאור המתמטי ולא להיפך. וכפי שהתברר לאחר זמן לא ארוך, כשמנסים לבנות מודל מתמטי שיתאר את כוחות המשיכה ההדדיים בין 3 גופים, המתמטיקה לא כל מצליחה לעשות את זה, בטח לא בקלות ובפשטות כמו החוק של ניוטון.

שנית,  סטיוארט כותב במקום אחד כי ניוטון פיתח את החוק/מודל שלו מתוך , ובמקום אחר הוא כותב כי ניוטון גזר את חוקי קפלר מתוך חוק הכבידה שלו. זה לא מסתדר לי ביחד. כפי שאני הבנתי מהציטוטים שסטיוארט הביא מדברי ניוטון, הטענה הנכונה היא הטענה הראשונהת ואזכיר את אמירתו של ניוטון עצמו כי הרחיק ראות מכיוון שעמד על כתפי ענקים.

ושוב: מה עם איינשטיין? איך אפשר לדבר על כבידה בלי להזכיר את איינשטיין?

המשוואה של הפרק החמישי אומרת כי i בריבוע שווה למינוס אחד.

זו בהחלט נקודת התחלה טובה לתיאור של המספרים המרוכבים. הבעיה הראשונה: זו לא המשוואה ששינתה את העולם בהקשר הזה, אלא משוואה אחרת. מצד שני, המשוואה הזו הרבה יותר פשוטה, ולכן אני לא מבקר את סטיוארט בעניין הזה.

סטיוארט מתחיל בתיאור של איטליה בתקופת הרנסנאס ואז עובר למשוואות אלגבריות. הוא חוזר אחורה בזמן אל הבבלים שידעו לפתור משוואות ריבועיות, ועובר לתקופה מאוחרת יותר בה החלו הניסיונות לפתור משוואות יותר מסובכות, כאלה שמכילות גם איקס בשלישית. הוא מציין מספר מתמטיקאים, בעיקר ערבים, שמצאו פתרונות חלקיים, כולל אל-ח'ואריזמי שמשמו נגזרה המילה אלגוריתם, ומקור המילה אלגברה הוא מכותרת ספרו "חיסאב אל-ג'אבר ואל-מוקאבלה" שיצא לאור בשנת 830. לבסוף חוזר אל איטליה והרנסנאס, ועורך לנו היכרות עם ג'ירולמו קרדאנו, איש רב פעלים ומעללים.

קרדאנו מופיע בסיפור כי הוא גילה/מצא את הפתרון הכללי למשוואה מהמעלה השלישית, ובמשותף עם תלמידו לודוביקו פרארי מצאו את הפתרון הכללי למשוואה מהמעלה הרביעית, כלומר משוואה שמופיע בה X בחזקת 4.

הנוסחה של הפתרון הכללי של המשוואה מהמעלה השלישית היא זו ששינתה את העולם. כמו נוסחת הפתרון למשוואה הריבועית, גם הנוסחה הזו כללה בתוכה הוצאת שורשים. אבל, לפעמים היה צורך להוציא שורש ממספר שלילי, וזאת כידוע בעיה.

פרארי פתר את הבעיה בכך שהתעלם ממנה. שורש של מספר שלילי? נו פרובלם, נמשיך כאילו כלום. מה איכפת לי אם יש שורש של מינוס ארבע עשרה? נמשיך הלאה ובסוף הוא יצטמצם, ומקבלים תשובה נכונה.

כאן נפתח הפתח אל המספרים המדומים, ומהם מגיעים אל המספרים המרוכבים. סטיוארט מתאר איך הרחיבו את המתמטיקה כדי לכלול בתוכה את המספרים האלה, ועל הדרך מספר כי e בחזקת i כפול π שווה למינוס 1. זוהי נוסחה מדהימה בלי כל ספק, אולי הנוסחה הכי יפה בכל המתמטיקה. סטיוארט מנסה להסביר איך מגיעים לשוויון הזה, אבל כושל.

בהמשך, סטיוארט אומר בקצרה שבעזרת מספרים מרוכבים אפשר לפתור משוואות דיפרנציאליות בקלות (יחסית, הכל יחסי) ואת ההשפעה העצומה של זה על התפתחות הטכנולוגיה. הוא גם מזכיר כמה אנשים שנתנו פרשנות גיאומטרית למספרים המרוכבים, כמו ואליס וגאוס, מסביר איך המילטון פיתח את ההגדרה הפורמלית, וזהו.

מה???

הנה כמה דברים שחסרים. קודם כל, זוכרים את הפרק על משפט פיתגורס? אם כבר מדברים על הרחבות של מערכת המספרים, מה עם המספרים האי רציונליים? תהיתי כבר אז, וחשבתי שהם ייכנסו במקום אחר. הפרק הזה, שבו מדברים על פתרון משוואות אלגבריות בעזרת שורשים יכול להיות מקום מצויין לדון בהם. אבל מספרים אי-רציונליים – יוק.

הנה עוד יוק אחד: סטיוארט מציין כי קארדנו ופרארי לא ידעו לפתור משוואה כללית מהמעלה החמישית, ומציין ביובש כי פיתרון כזה לא קיים, וזהו. לדעתי היה מקום לומר עוד כמה מילים או פסקאות בנושא, ולפחות להזכיר את ואת נילס אבל. סטיוארט לא חשב שזה חשוב או מעניין.

היוק השלישי: איך אפשר לכתוב פרק שלם על המספרים המרוכבים ולהזכיר את גאוס בפחות מרבע משפט? הוא מתעלם לחלוטין מהתרומה העצומה של גאוס לתחום. המשפט  היסודי של האלגברה, מישהו?

לדעתי סטיוארט נכשל בפרק הזה בגדול.

הפרק השישי עוסק בנוסחת הפאונים של ליאונרד אוילר: לכל פאון, מספר הפאות פחות מספר הצלעות ועוד מספר הקודקודים שווה ל-2.

אסביר: פאון הוא גוף הנדסי שמורכב ממשטחים, למשל קובייה או פירמידה.

קחו קובייה ותבדקו: לקובייה יש 6 פאות (כלומר 6 צדדים). כל שתי פאות מופרדות על ידי צלע, ובסך הכל יש לקובייה 12 צלעות. הצלעות נפגשות בקודקודים. לקובייה יש 8 קודקודים. 6 פחות 12 ועוד 8 שווה ל-2.

זה נכון גם לפירמידה. לפירמידות במצרים יש בסיסים מרובעים, ולכן לכל פירמידה יש 5 פאות: הבסיס המרובע ועוד 4 משולשים. קל להשתכנע כי לפירמידה יש 8 צלעות: 4 צלעות הבסיס, ועוד ארבע צלעות שמחברות את בסיס הפירמידה לקודקוד שלה. לסיום, לפירמידה יש 5 קודקודים: 4 בבסיס ועוד אחד בראש הפירמידה. 5 פחות 8 ועוד 5 שווה ל-2. קסם! את הנוסחה הזו הוכיח כאמור אוילר.

סטיוארט מסביר את רעיון ההוכחה, ואני אתרכז רק בפרט אחד, אבל חשוב: הרעיון הוא שלוקחים קובייה או פירמידה שעשויים מפלסטלינה, מכווצצים אותה לצורה של כדור או משהו דומה (ואיכשהו הפאות, הצלעות והקודקודים נשארים מסומנים). מה שחשוב הוא שפעולת הכווצוץ היא רציפה: אסור לקרוע את הפלסטלינה, וגם אסור להדביק קצה אחד של הגוש לקצה אחר. תוך כדי הכווצוץ מבצעים כל מיני פעולות על הגוש, ומסירים צלעות או קודקודים באופן כזה שמספר הפאות פחות מספר הצלעות ועוד מספר הקודקודים לא משתנה. למשל, אם הכווצוץ ידביק שני קודקודים זה לזה, אז שני הקודקודים יתמזגו לקודקוד אחד, אבל גם הצלע שמחברת אותם תיעלם, ולכן ההפרש בין מספר הצלעות ומספר הקודקודים לא משתנה.

ועכשיו יש טוויסט בעלילה: קחו מסגרת של תמונה. גם לה יש פאות וצלעות וקודקודים, אבל אם תחשבו את מספר הפאות של המסגרת פחות מספר הצלעות שלה ועוד מספר הקודקודים שלה לא תקבלו 2 אלא 0. הסיבה לכך היא שבמסגרת יש חור.

וכך, בשישה ציוצים, או בכמה דפים בספר, קיבלתם את ה-א"ב של הטופולוגיה. עד כאן סטיוארט עשה עבודה מצויינת. אבל כרגיל, הוא לא יודע לפרוש בשיא, וכותב כמה עמודים טובים (12 עמודים בעצם, ספרתי) של כניסה לפרטים טכניים, בשפה לא מובנת לאדם פשוט כמוני. אני אחסוך מכם את המעט שקראתי מתוך העמודים האלה.

לסיום, סטיוארט מנסה להסביר למה המשוואה הזו שינתה את העולם. האמת, המשוואה הזו שינתה בעיקר את עולם המתמטיקה בהיותה אבן היסוד לתחום הטופולוגיה. הוא מציין, ובצדק, שלטופולוגיה אין יישומים ישירים, אבל אומר משהו על פיזיקת קוונטים, ומבנה הד.נ.א.

הפרק השביעי עוסק, או אמור לעסוק, בהתפלגות הנורמלית. אני מניח שאתם מכירים אותי מספיק טוב כדי שלא תופתעו אם אומר לכם שהפעם באמת התעצבנתי. לכן הסקירה של הפרק הזה תהיה ארוכה, למרות שהתאפקתי מאוד כשכתבתי את הטיוטה לציוצים בטוויטר. מתנצל מראש.

בעיה ראשונה: בעמוד הראשון של כל פרק מופיעה המשוואה שהפרק אמור לדון בה, עם כל מיני הסברים. המשוואה שסטיוארט מציג בפרק הזה היא פשוט שגויה. לא נכונה מבחינה מתמטית. אין שום דרך לייפות את זה. השגיאה נמשכת גם בטקסט: הוא מבלבל בעקביות בין המונחים הסתברות והתפלגות (וגם צפיפות, למרות שהוא לא מזכיר את המונח).

אבל זאת לא סיבה להפסיק לקרוא כמובן. סטיוארט החליט להקדיש את כל הפרק הזה להסתברות וסטטיסטיקה, וכרגיל הוא מתחיל בסקירה היסטורית מבולבלת. הוא קופץ אל , יעקב ברנולי, קטלה, דה-מואבר, לז'נדר (תיכף ארחיב עליו), פרמה ופסקל, וסליחה אם שכחתי מישהו. אה, כן, שכחתי את גאוס. תיכף נגיע גם אליו.

נתחיל את סקירת הפרק בלז'נדר. סטיוארט מציין, ובצדק, שלז'נדר הוא שפירסם ראשון את שיטת הריבועים הפחותים, ונותן לו את כל הקרדיט על כך. מה עם גאוס? סטיוארט לא מתלהב ממנו. האמת היא שלז'נדר פירסם טכניקה, ללא כל הצדקה למה השיטה שלו עדיפה על שיטה אחרת.

גאוס הוא זה שקשר את שיטת הריבועים הפחותים להתפלגות הנורמלית, והראה מדוע זוהי השיטה האופטימלית להתאמת קו ישר לתצפיות; קוראים לזה משפט גאוס-מרקוב. אנחנו גם יודעים בוודאות כי גאוס הכיר את שיטת הריבועים עוד לפני שלז'נדר פירסם את המאמר שלו, אבל זה לא משנה לסטיוארט. ולמה בכלל קוראים להתפלגות הנורמלית גם בשם התפלגות גאוסיאנית? סטיוארט ממלמל משהו.

סטיוארט עובר לדבר על סיר פרנסיס גאלטון ועל עבודתו בחקר התורשה. כאן הוא דווקא עושה עבודה די טובה, ומתאר בפירוט את מחקריו של גאלטון שהובילו לעדויות האמפיריות הראשונות על תיאוריית האבולוציה של דודו . הוא מתאר את תופעת הרגרסיה לממוצע ואת הפיתוח הראשוני של מקדם המתאם. יש לו פה ושם אי דיוקים קלים, אבל בסך הכל זה בסדר.

עכשיו הגיע הזמן לסלט. סטיוארט מחליט לדבר על בדיקת השערות, וזורק לתוך הסלט הזה את רונלד פישר, קרל פירסון ובנו אגון פירסון, וכמובן גם את ג'רזי ניימן. אז קודם כל, פירסון האב לא שייך לכאן. אדרבא. הוא התנגד בעקביות לגישה של פישר לבדיקת מובהקות. מי שכן שייך אבל לא מוזכר הוא ויליאם סילי גוסט (הידוע בכינוי student) , הראשון שהגה את התובנה של בדיקת המובהקות, ועבודתו הייתה הבסיס לעבודה של פישר.

סטיוארט מנסה ניסיון אומלל להסביר מה זה בעצם בדיקת השערות. הוא מערבב את הגישה של פישר עם הגישה (המנוגדת) של ניימן ופירסון, ואני חושש שההסבר היחיד לכל הסלט הזה הוא שסטיוארט פשוט לא מבין כאן על מה הוא מדבר. אני לא מאשים אותו. זה קשה. אבל הוא היה יכול אולי להתייעץ עם מישהו שכן מבין. מצד שני, מכיוון ההסבר שלו כל כך מבולבל ומסורבל אני מעריך שאין סיכוי שמישהו יקרא את זה ולא יתייאש, ולכן לא ייגרם נזק.

לאחר הסלט, מה יותר מתאים לקינוח מאשר רגל קרושה? ב-1994 יצא לאור ספר בשם "The bell curve"  שביטא עמדות גזעניות בעזרת ניתוחים סטטיסטיים שגויים ומוטים ((מצטער, אבל אני לא נותן לינק לתועבה הזו)). סטיוארט מחליט להקדיש לספר האומלל הזה לא פחות מתשעה עמודים, תוך כדי התפזרות לכל מיני כיוונים שלא קשורים בכלל לסטטיסטיקה, או להתפלגות הנורמלית.

מה חסר בפרק הזה? הרבה, אבל אני רוצה להתעכב על דבר אחד חשוב באמת: סטיוארט כותב בתחילת הפרק כי ההתפלגות הנורמלית מהווה מודל טוב להרבה מאוד תופעות מהעולם האמיתי, וזה נכון.

אבל סטיוארט שוכח לציין כי יש הרבה מאוד תופעות מהעולם האמיתי שההתפלגות הנורמלית לא מהווה מודל טוב עבורם. המשבר הפיננסי של 2008 הוא דוגמה טובה, אם מכירים אותה כמובן. הערכת הסיכונים של כל בנקי ההשקעות השתמשו במודל שהתבסס על ההתפלגות הנורמלית, אבל ההתפלגות הייתה התפלגות קושי. אופס.

הדבר שהכי מטריד אותי בעקבות קריאת הפרק הזה הוא עד כמה ניתן לסמוך על סטיוארט בהמשך הקריאה. ככל שהספר יתקדם יהיו בו נושאים שאני פחות ופחות מכיר ומבין. האם אחרי שאקרא את הפרקים האלה אבין משהו בנושאים שלהם? מושגי יסוד? עד כמה הם אמינים? אני ממש לא יודע. ולכן החלטתי להפסיק כאן את הקריאה, והסקירה שלי הגעה לסופה.

יצירת דו"חות בפורמט Word מתוך R על ידי שימוש בחבילת officer

אם אתם עובדים עם תכנת R וצריכים ליצור דו"חות בפורמט Word באופן שגרתי, חבילת officer עשויה להיות שימושית עבורכם. הבעיה היא שהשימוש בחבילה מסורבל – manual שלה הוא בן 80 עמודים.

לכן כתבתי מספר פונקציות שמאפשרות לבצע את כל הפעולות שאני באמת צריך לעשות וליצור דו"חות בסגנון אחיד. בניגוד לפונקציות של החבילה המקורית, לפונקציות שלי יש מבנה אינטואיטיבי, מכיוון שכל הגדרות הסגנונות מוטמעים בתוכן.

אתם מוזמנים לקרוא את הפרטים בגירסה האנגלית של הבלוג: https://sciprincess.wordpress.com/2020/02/17/creating-ms-word-reports-using-the-officer-package/

ויזואליזציה של נתוני יחס חוב/תוצר

לפני מספר ימים ראיתי את הגרף הזה בטוויטר: (( הערה: ביצעתי כמה עריכות מינוריות בגרף לצורך ההדגמה בהמשך הפוסט ))

גיגול קצר העלה כי מדובר בגרף ישן יחסית מאוקטובר 2017. מצד אחד, זהו באמת גרף מאוד יפה ומרשים. מצד שני, מקומו בדפי פייסבוק כגון Trust me, I’m a Statistician או Trust me, I’m a Data Scientist.

גרף זה הוא סוג של דיאגרמת עוגה (pie chart).  בדיאגרמת עוגה קלאסית הפרוסות הן בצורת "משולשים", או גזרות של עיגול אם רוצים לדייק. כאן לפרוסות יש צורות אחרות, הכוללות משולשים, מרובעים, מצולעים אחרים, וצרות שאין לי מושג מה שמן (( ראו לדוגמא את בריטניה בתחתית הדיאגרמה))

אני מודה שהגרף הזה די בילבל אותי. מדובר בנתונים של חוב לאומי ויחס חוב/תוצר. בתחילה התייחסתי לנתון של יחס חוב/תוצר, ומשום מה חשבתי שהשטח של כל פרוסה בעוגה הזו מייצג את יחס החוב/תוצר של כל מדינה. זאת כנראה בגלל שהעין שלי תפסה קודם כל את הכותרת התחתונה.

בפועל, כל פרוסה מראה את החלק של המדינה מתוך סך כל החובות הלאומיים בעולם, ולכן סך כל השטחים אמור להסתכם ל-100%.  (( לא בדקתי את הנתונים האלה, אני מאמין למי שיצר את הדיאגרמה, וזה גם לא כל כך משנה לדיון כאן)).ניתן לראות בבירור כי המדינה עם החלק הגדול ביותר מתוך סך החובות היא ארצות הברית, ומכאן ג ניתן להסיק כי לארצות הברית יש את החוב המוחלט הגבוה ביותר במונחים דולריים. המדינה עם החלק השני הכי גדול בסך החובות היא יפן, וסין שלישית. מצאו בעוגה את הפרוסות של  איטליה, גרמניה, צרפת ובריטניה. לאיזה מדינה מבין הארבע יש חלק יותר גדול בעוגת סך החובות? האם אתם יכולים לקבוע זאת על ידי השוואת השטחים של הפרוסות?

יחס החוב/תוצר של כל מדינה מבוטא על ידי הצבע של הפרוסה בעוגה. ככל שהצבע בהיר יותר, כך יחס החוב/תוצר גבוה יותר. אפשר לראות מייד כי ליפן יש יחס חוב/תוצר גבוה מאוד. ניתן להבחין כי גם ביוון היחס הזה גבוה, למעשה השני בגובהו. האם אתם יכולים לזהות את המדינה עם היחס השלישי בגובהו? זוהי לבנון. חפשו אותה בפינה הימנית עליונה. איטליה ופורטוגל, שתופסות את המקום הרביעי והחמישי, בולטות יותר. האם אתם יכולים לראות לאיזה מדינה יש את יחס החוב/תוצר הנמוך ביותר?

לאחר שהבנו את הנתונים המוצגים בדיאגרמה הזו, אנו יכולים לנסות למצוא תובנות.

דיאגרמה זו היא למעשה גרף דו-מימדי, במובן שמוצגים בה שני משתנים שונים. בדרך כלל גרפים כאלה אמורים להראות את הקשר בין שני המשתנים. אז מה הקשר בין יחס החוב/תוצר ובין חלק החוב בסך כל החובות? אתם יכולים לראות? כי אני לא יכול. לזכותם של הכותבים ייאמר שהם לא ניסו לדון בכלל בעניין.

האם יש דרך טובה יותר להציג את הנתונים האלה באופן גרפי? כמובן שיש. בואו נשכח את כל מה שראינו עד עכשיו ונשחק קצת בנתונים.

לקחתי את נתוני יחס החוב/תוצר של כל מדינות העולם וגם את נתוני התוצר עצמם מויקיפדיה. לצורך ההדגמה, התמקדתי בנתוני מדינות ה-OECD  משנת 2017. מנתוני יחס החוב/תוצר ונתוני התוצר אפשר כמובן לחשב את גובה החוב, משם את סך החובות, ולבסוף את חלקה של כל מדינה מתוך סך החובות. הנתונים נמצאים כאן.

האפשרות הפשוטה ביותר היא לשרטט תרשים פיזור (scatter plot) משרטטים את הנתונים במערכת צירים, כשכל מדינה מיוצגת על ידי נקודה. המרחק של הנקודה מכל אחד מהצירים מייצג את הערך המתאים של הנתון.

הנה דיאגרמת פיזור בסיסית המציגה את הנתונים שלנו. למעוניינים, קוד R נמצא בגרסה האנגלית של הפוסט הזה.

בדיאגרמה ניתן לראות בבירור כי יש שתי נקודות/מדינות חריגות: אחת מהן עם יחס חוב/תוצר גדול מ-200%, חלקה של השניה בסך כל החובות גבוה מ-30%.

עיון נוסף מגלה מדינה שיחס החוב/תוצר שלה גבוה מ-150%, ועוד שתי מדינות שיחס החוב/תוצר שלהן באיזור ה-130%.

מאחר ויש כלכלנים שסבורים כי חוב גבוה זה רע, וחוב גבוה ביחס לתוצר הוא עוד יותר רע, החלטתי לחלק את הנקודות/מדינות לשלוש קבוצות:

  • בקבוצה הראשונה נכללות המדינות שיחס החוב/תוצר שלהן גבוה מ-100% או שחלקן בסך החובות גבוה מ-10%. אלה המדינות שמצבן הכלכלי "רע" על פי הפרמטרים האלה.
  • בקבוצה השניה נכללות המדינות שיחס החוב/תוצר שלהן נמוך מ-50% וגם חלקן בסך החובות נמוך מ-2%. אלה המדינות שמצבן הכלכלי "טוב" על פי הפרמטרים האלה.
  • הקבוצה השלישית כוללת את כל שאר המדינות.

קווי הגבול בין הקבוצות (2%, 10% וכולי) הם שרירותיים משהו. קבעתי אותם על פי מיטב שיפוטי. (( אם אתם מכירים כלכלן שיכול לקבוע את קווי הגבול באופן יותר מדוייק (במובן accuracy, לא במובן precision) , אשמח אם תכירו לי אותו ))

שרטטתי מחדש את הגרף: את הנקודות של המדינות שמצבן "רע" צבעתי באדום, והוספתי לגרף גם את שמה של כל מדינה מקבוצה זו. את הנקודות של המדינות שמצבן "טוב" צבעתי בירוק, ואת שאר הנקודות צבעתי בכתום:

עכשיו ניתן לראות כי:

  • יחס החוב/תוצר של המדינות שמצבן "טוב" משתרע על כל הטווח מ-0 עד 50, אם כי יש בקבוצה זו יותר מדינות שיחס החוב/תוצר שלהן מתקרב ל-50%.
  • מדינות הביניים מתחלקות בערך לשתי קבוצות: קבוצה אחת עם רמת חובות מוחלטת (כאחוז מסך החוב) נמוכה ויחס חוב/תוצר בין 50 ל-75 בערך, וקבוצה שניה של חמש מדינות  עם רמת חובות מוחלטת גבוהה יותר, כאשר לא ניתן לומר אמירה ברורה על מכנה משותף ביניהן לגבי יחס חוב/תוצר.

ממתאם לסיבתיות – מבחן הסיבתיות של גרייג'ר

היסטוריה וקונטקסט

הוא סטטיסטיקאי וכלכלן וולשי אמריקני, שזכה בפרס נובל לכלכלה ((במשותף עם רוברט פ. אנג'ל )) בשנת 2003, בזכות תרומותיו לתיאוריה ולמתודולוגיה של . בשנת 1969 הציע גריינג'ר מבחן סטטיסטית לבדיקת השערת הסיבתיות בקונטקסט של סדרות עיתיות.

הקריטריונים של ברדפורד היל שהוצגו ב-1965 מתאימים בעיקר לבעיות בתחום האפידמיולוגיה ובריאות הציבור, שם מתעניינים בדרך כלל בחשיפה לגורם סיכון או התערבות, ובתוצאה בריאותית חיובית או שלילית, לפי ההקשר. בעוד שניתן ליישם את הקריטריונים גם בתחומים אחרים, למשל פסיכולוגיה ותחומים נוספים במדעי החברה, חלק ניכר מקריטריונים אלה אינם ישימים כאשר דנים בסדרות עיתיות, שלהן חשיבות מיוחדת בכלכלה. לכן נדרש כאן פיתרון אחר. הוא פיתרון אפשרי.

סדרה עיתית היא סדרה של נתונים הנאספים לאורך זמן. לכל נתון מצורפת נקודת הזמן בה נדגם הנתון. אתם מכירים הרבה סדרות כאלה. הלשכה המרכזית לסטטיסטיקה מפרסמת כל חודש את השכר הממוצע ואת מדד המחירים לצרכן.  בנק ישראל מפרסם מדי יום את שער החליפין בין השקל לדולר. השירות המטאורולוגי מפרסם כל יום מה הייתה הטמפרטורה בצהריים בכל מיני מקומות בארץ.

מבחן גריינג'ר

גריינג'ר התבסס על שתי הנחות יסוד:

  1. הגורם מתרחש לפני התוצאה
  2. הגורם מכיל מידע ייחודי על התוצאה

בעוד שההנחה הראשונה ברורה ומובנת מאליה, ההנחה השניה דורשת הסבר.

קודם כל, זכרו כי כאן אנו דנים בסיבתיות בקונטקסט של זמן. לכן ניסוח יותר מדוייק של ההנחה השניה היא כי הגורם מכיל מידע ייחודי אודות הערכים העתידיים של התוצאה. כלומר, מדובר בגורם המכיל מידע ייחודי לחיזוי של התוצאה.

נניח כי אנחנו יכולים לחזות במידת הצלחה כלשהי את הערכים העתידיים של התוצאה כאשר בידינו כל המידע האפשרי בעולם. מה יקרה אם נשליך החוצה את המידע על המשתנה שלדעתנו גורם את התוצאה, ונשתמש רק בשאר המידע?

אשתמש בדוגמה: האם הטמפרטורה בצהריים בתל אביב משפיעה על היקף מכירות הגלידה בעיר? ובפרט, האם טמפרטורה גבוהה יותר גורמת למכירת יותר גלידה?

אנחנו יכולים לאסוף נתונים על שני המשתנים האלה, ולקבל שתי סדרות עיתיות.

השלב הבא הוא לבנות שני מודלים לחיזוי היקף מכירת הגלידה היומי. במודל אחד אתם יכולים להסתמך על כל המידע שיש בעולם ועומד לרשותכם. כמובן שנתוני הטמפרטורה נכללים במידע עליו אתם יכולים להסתמך.

והנה הטוויסט: במודל השני אסור לכם להסתמך על נתוני הטמפרטורה. חוץ מזה הכל הולך.

אם החיזויים של שני המודלים שונים באופן משמעותי, המסקנה היא כי הטמפרטורה משפיעה על היקף מכירות הגלידה. במקרה כזה נאמר כי הטמפרטורה היא גורם סיבתית על פי גריינג'ר להיקף מכירות הגלידה.

עכשיו נמקד את תשומת ליבנו על המילים "באופן משמעותי". איך מחליטים אם הבדל הוא משמעותי? גריינג'ר הציע להשתמש במבחן סטטיסטי, כלומר לזהות משמעות עם מובהקות סטטיסטית. המבחן שלו מסתמך על מודלים של אוטורגרסיה, מבחני t ומבחני F, שהם הכללות של רגרסיה לינארית. היא הפנים האחרות של . במילים אחרות, גריינג'ר הציע נתיב שמוביל ממתאם לסיבתיות.

זהו נתיב מסוכן, וגריינג'ר ידע זאת היטב. בנאום שנשא בטקס שבו הוענק לו פרס נובל, גריינג'ר התייחס למבחן הסיבתיות שהציע ואמר כי "התפרסמו הרבה מאמרים עם תוצאות מגוחכות".

ביקורת על מבחן גריינג'ר וחולשותיו

ראשית, יש לשים לב כי הסיבתיות מוסקת על סמך חיזוי. לא מוצע מנגנון סיבתי, ופורמלית אין צורך להציע מנגנון כזה. זהו פער משמעותי בין גריינג'ר ובין הקריטריונים של ברדפורד היל המחייבים הצעה של מנגנון כזה. טענה שקולה היא הטענה כי מבחן גריינג'ר אינו עונה על השאלה הפורמלית ושאלת הנימוק של אריסטו.

שנית, מי שמשתמש במבחן בחוסר זהירות, עלול ליפול בכשל הפוסט הוק, טענה מוטעית לפיה אם Y  קרה לאחר X  אז X  גרם ל-Y. אמנם, כפי שטען , קיום הטמפורליות הוא תנאי הכרחי לסיבתיות, אך תנאי זה בהחלט אינו מספיק.

המבחן גם לא לוקח בחשבון , כאלה המשפיעים על שני משתנים אחרים ויוצרים ביניהם מתאם מלאכותי (spurious correlation). לא במקרה בחרתי לדוגמה את הגלידה והטמפרטורה. אני מניח שכולם מכירים את הדוגמה המשעשעת שבה יש מתאם בין מכירות הגלידה ומספר הטביעות בבריכה. ככל שמוכרים יותר גלידה, יותר אנשים טובעים. האם ניתן להסיק על פי מבחן גריינג'ר כי קניית גלידה גורמת לטביעות? ייתכן מאוד שכן.

מגבלות נוספות של סיבתיות גריינג'ר הן: (( ראו A review of the Granger-causality fallacy –  Mariusz Maziarz – קישור לקובץ pdf ))

  • רגישות לתדירות הסדרות העיתית ולמשך הזמן בו צופים בהן. לדוגמה, מחקר האוצר על מה שכונה "שכר המינימום ונזקיו" שפורסם בשנת 2004, חזה כי העלאת שכר המינימום תגרום לעליה באבטלה, בין היתר על ידי שימוש בסיבתיות גריינג'ר. כפי שציינתי בפוסט שהתייחס למחקר הנ"ל, בעיה מרכזית במחקר הייתה בכך שהוא הסתמך על נתונים שהתייחסו לתקופה קצרה יחסית של 11 שנים, בעוד שבזמן עריכת המחקר שכר המינימום כבר היה נהוג בישראל במשך יותר מ-30 שנה.
  • חוסר יכולת לזהות סיבתיות לא לינארית
  • חוסר יכולת להתמודד עם סדרות עיתיות לא לינאריות ו/או לא סטציונריות
  • ההנחה של ההתפלגות הנורמלית של טעויות המדידה לא תמיד מתקיימת.
  • היפוך הזמן: בתנאים מסויימים ניתן לחזות את ערכי העבר על ידי ערכי העתיד. מבחני גריינג'ר יראו גם במקרים אלה סיבתיות, אלא שהגורם קרה לאחר התוצאה.

למרות המגבלות האלה, מבחן גריינג'ר וההכללות שלו נמצאים בשימוש נרחב. על המשתמשים בו לעשות זאת בזהירות, וכל טענה לסיבתיות על פי גריינג'ר צריכה להיבחן לגופה באופן ביקורתי.

הפוסטים הקודמים בסדרה

הפוסטים הבאים בסדרה

הודעה – עמוד מצגות

היום יצרתי עמוד חדש באתר נסיכת המדעים ובו יהיו קישורים למצגות של הרצאות שנתתי במשך השנים. העמוד יתעדכן עם הזמן, והודעות על העדכונים יתפרסמו בדף הפייסבוק של נסיכת המדעים.