מה אומרת הסטטיסטיקה | נסיכת המדעים

ארכיב עבור תגית מה אומרת הסטטיסטיקה

הקשר בין טיפול הורמוני חליפי והתפתחות קרישי דם

בתחילת 2019, פורסמה ידיעה בעיתון דיילי מייל לפיה כי טיפול הורמונלי חליפי (Hormone Replacement Therapy) בזמן המנאופוזה מכפיל את הסיכון לקרישי דם מסוכנים, כלשון הכותרת..

בניגוד למה שקורה בדרך כלל, הידיעה ציטטה גם את הנתון הבאשמסרו החוקרים מאוניבריטת נוטינגהאם: "על כל 10000 נשים המקבלות טיפול החלפת הורמונים, יש רק 9 מקרים נוספים של קרישי דם מדי שנה". זוהי פיסת מידע חשובה. מהו בעצם הנתון הזה?

אני אתעלם מהתשובות הלא נכונות שהוצעו (שינוי באחוזים, מספר החולים שיש לטפל בהם, (( במדד זה אדון בהמשך הסדרה )) וקצב קפלן-מאייר) ואעבור מייד להסבר.

הנתון שדווח הוא הגידול המוחלט בסיכון.

לפני שנגיע לדיון, קצת פרופורציות: לפי הכותרת, הסיכון להתפתחות קרישי דם בקרב נשים המקבלות טיפול הורמונלי גבוה פי שניים מהסיכון אצל נשים שלא מקבלות טיפול כזה. זה לא ממש מדוייק. קריאה זהירה במאמר שפורסם ב-BMJ מעלה כי הנתונים שמדווחים אינם סיכונים יחסיים אלא יחסי סיכונים (odds ratios). אני אדון ביחסי הסיכונים בהמשך הסדרה. כמו כן, יחסי הסיכונים משתנים על פי סוג הטיפול ודרך המתן. מדווחות תוצאות שונות לגבי סוגים שונים של טיפולים הורמונליים, ואכן עבור אחד מהם יחס הסיכונים נאמד כ-2.1, ולטיפולים אחרים היו יחסי סיכונים נמוכים יותר. עבור אחד הטיפולים המקובלים יחס הסיכונים היה נמוך באופן משמעותי מ-1, כלומר לטיפול הספציפי הזה היה אפקט מונע נגד הופעת קרישי דם. יחס הסיכונים המשוקלל על פני כל סוגי הטיפולים היה 1.6 בערך. עד כאן בנוגע לפערים בין כותרות זורעות בהלה ובין המציאות.

מה המשמעות של הגידול המוחלט בסיכון? נניח שאצל כל 10000 נשים שאינן מקבלות טיפול הורמונלי, יש מקרה אחד של היווצרות קרישי דם בכל שנה. הסיכון המוחלט הוא לכן 1 מתוך 10000, (או 0.01%, למי שאוהב אחוזים). לפי דברי החוקרים, עקב הטיפול ההורמונלי יש 9 מקרים נופים בשנה. כלומר, עוד 9 נשים מתוך 10000 יפתחו קרישי דם עקב הטיפול. באחוזים, ובסך הכל יהיו 10 נשים מתוך 10000 שיפתחו קרשי דם.

מה אם ההנחה הראשונה שלנו לא נכונה, ולמעשה מבין במקום אישה אחת, מבין כל 10000 נשים שאינן מקבלות טיפול הורמונלי, קרישי דם מתפתחים אצל 9 נשים? זה לא משנה – הנתון שנמסר עדיין אומרי כי יהיו 9 מקרים נוספים, ובסך הכל 18 במקום 9.

למעשה, אם נפרש את הכותרת של הדיילי מייל כמדווחת על סיכון יחסי, ונניח כי הנתון של תוספת 9 מקרים הוא נתון המשקלל את כל סוגי הטיפולים, נוכל לעשות חישוב לאחור. תוספת של 9 מקרים פירושה הכפלת הסיכון (( וזה כאמור לא נכון )), כלומר ללא טיפול יש 9 מקרים ועם טיפול יש 18 מקרים מתוך 10000. אם נבטא את הסיכון באחוזים, נקבל כי הסיכון עלה מ-0.09% ל-0.18%. הפרש הסיכונים הוא רק 0.09%.

רשימה זו היא הרשימה הרביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 6 בספטמבר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

הגלולה למניעת הריון והסיכון למוות עקב פקקת ורידים

מחקר משנת 1995 דיווח כי שימוש הכפיל את הסיכון למוות עקב . איזה נתון סטטיסטי דווח כאן?

השאלון מציע ארבע תשובות אפשריות: המצאות (prevalence), סיכון מוחלט (Absolute risk), מדד g של כהן למדידת גודל האפקט ((אין דבר כזה: יש Cohen's d וגם Hedegs' g)), וגם את התשובה הנכונה שהיא הסיכון היחסי (relative risk) המכונה לעיתים בשם יחס הסיכונים (risk ratio).

אסביר תחילה את נושא הסיכונים באמצעות דוגמה (( לא אתייחס כאן לנושאי ההמצאות וגודל האפקט )), ואחר כך אתייחס לנושא הקשר בין הגלולה למניעת הריון לפקקת הורידים.

כשאנחנו מדברים על סיכונים, יש שני מושגי יסוד: הראשון הוא גורם הסיכון: למשל עישון, שימוש בגלולה למניעת הריון או השתתפות בקורס מבוא לסטטיסטיקה. המושג השני הוא התוצא הבריאותי, כגון תחלואה בסרטן, פקקת ורידים או היהפכות לזומבי.

הסיכון המוחלט הוא ההסתברות שהתוצא הבריאותי יארע. בדרך כלל אומדים אותו כפרופורציה באוכלוסייה. נניח לדוגמה כי באוכלוסייה של 10000 אנשים בריאים 20 אנשים הפכו לזומבים. אם נחלק 20 ב-10000 ואחר כך נכפיל במאה נקבל כי הסיכון המוחלט להפיכה לזומבי הוא 0.2%.

לעומת זאת, בקבוצה של 10000 סטודנטים שנחשפו לקורס מבוא לסטטיסטיקה, 40 סטודנטים הפכו לזומבים, וזה סיכון של 0.4%. החשיפה לקורס הכפילה את הסיכון פי 2, מ-0.2% ל-0.4%. אנו אומרים לכן כי הסיכון היחסי הוא 2.

אבל צריך להיזהר מסיכונים יחסיים, כי הם לא משקפים את העלייה בסיכון. בדוגמת הזומבים, הסיכון הוכפל אבל עלה רק ב-0.2%. לא צריך לזלזל, אבל צריך גם לשמור על פרופורציות. לטעמי, דיווח של הפרש הסיכונים מועיל יותר להערכת סיכונים מאשר דיווח על הסיכון היחסי.

מה בקשר לפקקת הורידים?

אזהיר תחילה כי אין להסתמך על הנתונים שאביא כאן כדי לקבל החלטה כזו או אחרת או כדי להמליץ המלצות. יש כאן הערכות שרמת הדיוק שלהן לא ידועה, והנחות שרירותיות שאניח לצורך ההדגמה.

על פי ויקיפדיה, הסיכון המוחלט לפקקת ורידים אצל נשים המשתמשות בגלולה למניעת הריון הוא 60 מקרים ל-100000 שנות חיים, לעומת 30 אצל נשים שלא משתמשות בגלולה. ((הנתון של 60 מקרים הוא למעשה ממוצע, כיוון שהסיכון משתנה בהתאם לסוג הגלולה והרכבה)) כלומר, הסיכון אכן מוכפל, והסיכון היחסי לתחלואה הוא 2. הסיכון היחסי למוות כנראה דומה, אך לא ברור האם יש הבדל בשיעורי התמותה בין נשים המשתמשות בגלולה ונשים שאינן משתמשות בגלולה. שיעורי התמותה תוך שנה מאירוע הפקקת נעים בין 50% ל-90%, תלוי במקרה הספציפי. על פי מכון קוקריין, יחס הסיכונים גבוה יותר ומגיע במקרים מסויימים עד ל-3.5 – תלוי בהרכב הגלולה ומשך השימוש. בהחלט אין להקל ראש בסיכון הזה, אבל כפי שציינתי קודם, חשוב יותר לדעת את הפרש הסיכונים. אני אשתמש בנתוני ויקיפדיה כדי להדגים זאת.

מה הכוונה ב-100000 שנות חיים? הסיכון משתנה עם רמת החשיפה. אין דין אישה שהשתמשה בגלולה במשך שנתיים כדין אישה שהשתמשה בגלולה 15 שנה. לכן יש לשקלל את נתוני התחלואה במשך השימוש בגלולה. בואו נניח, לצורך הדוגמה בלבד, כי אישה ממוצעת משתמשת בגלולה במשך 20 שנים. לכן מאה אלף שנות חיים שקולות ל-5000 נשים (( 5000×20=100000 )). 30 מקרים מתוך 5000 הם 6 מתוך 1000, כלומר ניתן, תחת ההנחה הנ"ל, (( שימוש ממוצע של 20 שנה בגלולה )) כי בקרב נשים שלא משתמשות בגלולה, 6 מתוך כל 1000 יחלו בפקקת העורקים, ובקרב הנשים המשתמשות בגלולה 12 מתוך כל 1000 יחלו. בדוגמה זו, השימוש בגלולה יוסיף עוד 6 נשים חולות לכל 1000. זהו נתון שממחיש את רמת הסיכון: עוד 6 נשים מכל 1000 יחלו, ובסיכוי גבוה גם ימותו, אם ישתמשו בגלולה למניעת הריון במשך 20 שנה. לדעתי מידע זה מאפשר החלטה מושכלת יותר לגבי נטילת הסיכון.

רשימה זו היא הרשימה השלישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 2 בספטמבר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

כמה חיים מצילה הבדיקה לגילוי מוקדם של סרטן הערמונית?

פציינט שואל את הרופא שלו האם כדאי לו לעבור בדיקת PSA לגילוי מוקדם של . מהו הנתון שהרופא צריך להציג לחולה כדי שיוכל לקבל החלטה מושכלת?

מוצעות ארבע תשובות אפשרויות.

התשובה האפשרית הראשונה היא כי על הרופא להציג את מספר מקרי הסרטן באוכלוסיית חולים שעברו בדיקה לגילוי מוקדם, ומספר מקרי הסרטן באוכלוסיית של חולים שלא עברו בדיקה לגילוי מוקדם. יש שתי סיבות לכך שההצעה הזו לא נכונה. ראשית, אני מקווה שמובן מאליו כי יש להציג מספרים מתוקננים לגודל האוכלוסייה. הסיבה השנייה גם היא ברורה מאליה, לדעתי: מספר מקרי הסרטן אינו מושפע מעצם קיום או אי קיום בדיקות לגילוי מוקדם.

תשובה אפשרית נוספת מוצעת היא כי על הרופא להציג את שיעור/אחוז השורדים כעבור חמש שנים מעת גילוי המחלה עבור חולים שעברו בדיקה לגילוי מוקדם ועבור אלה שלא עברו בדיקה כזו. ההסבר המפורט לכך שהשוואה זו הינה חסרת משמעות הופיע בפוסט קודם. בקצרה: אצל חולים שלא עברו בדיקה לגילוי מוקדם עבר זמן רב יותר מאז הופעת המחלה בהשוואה לאלה שכן עברו בדיקה לגילוי מוקדם, ולכן בסיס ההשוואה אינו זהה בין שתי הקבוצות.

הצעה נוספת היא להציג בפני הפציינט את ההסתברות כי הנבדק אכן חולה בסרטן הערמונית בהינתן כי תוצאת הבדיקה חיובית. (( נתון זה נקרא של הבדיקה ונדון בו ביתר פירוט בהמשך הסדרה )) בהצעה זו יש שתי בעיות. ראשית, האומדנים להסתברויות מסוג זה הינם מאוד לא מדוייקים. יש צורך לדעת כמה מבין התוצאות החיוביות הינן חיוביות אמיתיות (כלומר, הבדיקה זיהתה מחלה והנבדק אכן חולה) וכמה הן חיוביות שגויות (כלומר, הבדיקה זיהתה מחלה והנבדק אינו חולה). בפועל, ברוב מוחלט של המקרים בהם תוצאת הבדיקה חיובית מבוצעת פרוצדורה רפואית, ולכן אי אפשר לדעת אם התוצאה שגויה או לא – כדי לדעת זאת צריך לא לטפל בנבדק ולראות מה יקרה לו, וזה כמובן לא קביל.

שנית: ההסתברות הזאת לא אומרת דבר על סיכויי ההישרדות/החלמה אם הפציינט אכן חולה. היא רק מעידה על רמת הדיוק של הבדיקה.

הנתון שיאפשר לחולה לקבל החלטה הוא שיעורי התמותה בקרב חולים שעברו בדיקה לגילוי מוקדם ובקרב אלה שלא עברו בדיקה כזו, כאשר שתי האוכלוסיות הן בנות השוואה (comparable), למשל: גברים שעברו בדיקה לגילוי מוקדם בגיל 50 לעומת גברים בני 50 שלא עברו בדיקה כזו. אם הבדיקה אכן מצילה חיים, נצפה לפחות מקרי מוות עקב סרטן הערמונית בקבוצה הראשונה.

רשימה זו היא הרשימה השניה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 27 באוגוסט, 2019. נושאים: בריאות, מה אומרת הסטטיסטיקה.
תגובות: 5 | טראקבק

היכן הטיפול בסרטן הערמונית טוב יותר?

כאשר רודי ג'וליאני (ראש עיריית ניו יורק לשעבר) ביקר בלונדון, הוא התייחס לשירותי הבריאות הלאומיים של בריטניה (NHS) ואמר:

"אובחנתי כחולה לפני 7 שנים. הסיכוי שלי להישרדות בארצות הברית הוא 82%, ובאנגליה הסיכוי הוא פחות מ-50%". לכן הסיק ג'וליאני כי הטיפול בסרטן הערמונית בארצות הברית טוב יותר מהטיפול בבריטניה.

מאוחר יותר התברר כי הנתונים שג'וליאני ציטט הם נתוני הישרדות בחיים לאחר 5 שנים מתאריך האבחון. מהי הבעיה בהסקת מסקנות על סמך נתונים אלה בלבד?

עורכי השאלון הציעו ארבע תשובות אפשריות.

התשובה האפשרית הראשונה היא הטיית האישור – confirmation bias. זוהי הנטייה לחפש, לפרש, להעדיף, ולזכור מידע באופן שמאשר אמונות או השערות, תוך מתן תשומת לב פחותה במידה בלתי-פרופורציונלית למידע שתומך באפשרויות חלופיות. ג'וליאני לא לקה בהטייה זו. הוא הסתמך על נתונים נכונים ולא התעלם מהם . הוא אכן לא הסתמך על נתונים אחרים, לפחות באמירה הזו, אולם לא ניתן לקבוע בוודאות אם עשה זאת בכוונה.

תשובה אפשרית נוספת היא הטיית הבחירה (selection bias). הטייה זו היא עיוות בנתוני מחקר הנובע מהטיה בצורת איסוף המידע. ג'וליאני כמובן לא ביצע את המחקר בעצמו. הוא לא לקה בהטייה זו. ייתכן כי המחקרים עליהם התבסס לקו בהטייה זו, אבל זהו סיפור אחר.

עוד תשובה שהוצעה היא הטיית הביצוע (performance bias). הטייה זו מתבטאת בכך שבניסוי מבוקר קבוצת טיפול אחת מקבלת תשומת לב רבה יותר מהחוקרים מאשר הקבוצה השנייה. זה יכול לקרות למשל בניסוי בו משווים תרופה חדשה לתרופה קיימת, ואי אפשר לקיים סמיות – לפחות חלק מהחולים יודעים איזה טיפול הם מקבלים, וגם הרופאים יודעים זאת כמובן. זה יכול לקרות אם למשל תרופה אחת ניתנת בהזרקה והשנייה בבליעה (( ראו למשל את הידיעה על הניסוי הזה בו נערכה השוואה בין שתי תרופות לטיפול בטרשת נפוצה: ג'ילניה ניתנת בבליעה, קופקסון בהזרקה. )) במקרה שלנו זה לא המקרה: שני הנתונים שצוטטו הגיעו כל אחד ממחקר אחר.

ההבדל בין שני נתוני ההישרדות נובעים מהטיית lead-time bias . (( לא ברור לי איך לתרגם זאת לעברית. אשמח לשמוע הצעות )) הנתונים שג'וליאני ציטט התייחסו להישרדות מרגע האבחון. בארצות הברית נהוג לבצע בדיקות לאבחון מוקדם של סרטן הערמונית, וזאת בניגוד לנהוג בבריטניה. לכן משך הזמן העובר בין תחילת המחלה עד לאבחון קצר יותר בארצות הברית מאשר בבריטניה. מכיוון שסרטן זה מאובחן בשלב יותר מוקדם בארצות הברית, הסיכויים לשרוד במשך 5 שנים מזמן האבחון גבוהים יותר לעומת אבחון לאחר הופעת סימפטומים מחשידים הנהוג בבריטניה. בגלל ההטיה הזו, אוכלוסיות הגברים בארצות הברית ובבריטניה אינן בנות השוואה, ככל שהדבר נוגע לנתוני הישרדות של חולי סרטן הערמונית.

הנה דוגמה מספרית פשוטה. נניח לצורך הדוגמה כי אבחון מוקדם מזהה את המחלה כשנתיים לאחר תחילתה, בעוד שללא אבחון מוקדם המחלה מזוהה כחמש שנים לאחר תחילתה. כמו כן, לכן, בארצות הברית, אדם ששרד 5 שנים לאחר האבחון שרד למעשה 7 שנים לאחר הופעת המחלה, בעוד שבבריטניה אדם ששרד 5 שנים לאחר האבחון שרד למעשה 10 שנים מתחילת המחלה. בדוגמה זו, מצבו של החולה הבריטי יותר טוב כרגע מזה של האמריקני.

רשימה זו היא הרשימה הראשונה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 20 באוגוסט, 2019. נושאים: בריאות, מה אומרת הסטטיסטיקה.
תגובות: 7 | טראקבק

שאלון יכולת הערכת נתונים סטטיסטיים רפואיים – אוניברסיטת קיימברידג'

מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג' פירסם לאחרונה שנועד לעוסקים בתחומי הרפואה והבריאות להעריך את יכולתם בהבנת נתונים סטטיסטיים אודות התועלת והנזק של טיפולים רפואיים.

גם אם אינכם עוסקים בתחומים האלה, אני חושב שכדאי שתכירו חלק מהמושגים האלה. אתם יכולים כמובן לנסות לענות בכל מקרה, ולאחר שתסיימו לענות על כל השאלות, תוכלו לקרוא את התשובות הנכונות בתוספת הסבר קצר לכל תשובה.

הנכם מוזמנים לקרוא:

נשלח: 5 באוגוסט, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: 1 | טראקבק

רחובות הסרטן והאנטנות הסלולריות

ב-25.2.2019 התפרסמה בעיתון ידיעות אחרונות כתבה תחת הכותרת "רחובות הסרטן". הנה ציטוט כותרות המשנה:

מקום לדאגה: ברדיוס של 500 מטרים במרכז ראש־העין התגלו בשנים האחרונות עשרות מקרים של סרטן • כארבעים בני אדם כבר נפטרו מהמחלה • התושבים בטוחים שהגורם לתחלואה הוא אנטנות סלולריות שניצבות על גג בניין השייך לעירייה • "שנים שאנחנו זועקים ואף אחד לא מקשיב", הם טוענים, "אנשים מתים פה אחד אחרי השני".

הכתבה הזו ללא ספק מעודדת פניקה. עוד באותו יום הופיע פוסט בפייסבוק בקבוצה של תושבי העיר שלי, המזהיר מפני שתי אנטנות סלולריות שניצבות על גג התחנה המרכזית בעיר. "אנשים ימותו!" נכתב בפוסט שזכה לעשרות לייקים ותגובות נסערות.

אני לא מזלזל בכאבם של תושבי ראש העין, להפך. אני גם לא מתכוון לדון במספרים שהוזכרו בכתבה. אני מקבל אותם כפי שהם. אני רק רוצה להתייחס רק לטענה כי הגורם לתחלואה הוא אנטנות סלולריות. קל (לי לפחות) להסביר למה הטענה הזו לכל הפחות מוטלת בספק: יש עוד הרבה אנטנות סלולריות בהרבה מקומות, וסביבן אין שיעורי תחלואה גבוהים בסרטן. אם האנטנות מסרטנות, אז הן צריכות לסרטן בכל מקום, לא רק בראש העין.

אז למה דווקא בראש העין יש מקבץ ((cluster)) כל כך גדול של תחלואה בסרטן? תשובה אפשרית אחת היא שיש שם גורם סביבתי בעייתי אחר שאינו קיים במקומות אחרים. תשובה אפשרית אחרת היא שייתכן שיש גורם אחר לא סביבתי שאינו קיים במקומות אחרים, אולי גורם גנטי. אפשרות שלישית ועצובה במיוחד היא שהתושבים במקום סובלים מביש מזל.

והנה העניין: אם אין גורמים מקומיים (סביבתיים או אחרים) שגורמים לסרטן (או למחלה אחרת), והתחלואה מתפזרת באופן מקרי על פני כל הארץ, אז נוצרים מקבצים. חוקי הסטטיסטיקה עשויים להיות אכזריים.

אסביר בקצרה: אם פיזור מקרי התחלואה על פני הארץ הוא אקראי, ומחלקים את הארץ ליחידות שטח שוות בגודלן, אז התפלגות מספר המקרים ביחידת שטח מסויימת היא . ואז יש הסתברות, אמנם קטנה, שבאחת מהיחידות האלה יהיה מקבץ גדול של מקרי תחלואה. הבעיה היא שאין אפשרות לדעת מראש איפה זה יקרה.

גם ההפך נכון: אם התפלגות מספר המקרים ביחידת שטח מסויימת היא התפלגות פואסונית, אז ניתן להסיק כי הפיזור על פני השטח הוא אקראי.

הפעם אדגים את התופעה בעזרת סימולציה. (להלן קישור לתכנית R שבעזרתה ביצעתי את הסימולציה)

נניח כי קיימת מדינה שצורתה ריבוע מושלם, בגודל 100×100 קילומטר. פיזרתי באופן אקראי 400 מקרי תחלואה על פני הארץ בכל פעם הגרלתי שני מספרים מקריים בין אפס ל-100 שקבעו את הקואורדינטות של המקרה. הנה המפה שקיבלתי. יש בה ארבע מאות נקודות.

חילקתי את המפה ל-100 ריבועים, כל אחד בגודל 10×10 קילומטר.

ספרתי כמה נקודות/מקרים יש בכל אחד ממאה הריבועים. הנה טבלה עם תוצאות הספירה:

מספר המקרים	0	1	2	3	4	5	6	7	8	9
מספר האיזורים	1	5	19	19	18	16	13	3	5	1

מסתבר שיש איזור אומלל אחד שבו התגלו 9 מקרי תחלואה, 5 איזורים עם 8 מקרי תחלואה, ו-3 עם 7 מקרי תחלואה. לעומת זאת יש איזור אחד בר מזל שבו כולם בריאים, ועוד 5 איזורים שבהם היה רק מקרה אחד. סימנתי את האיזורים האלה במפה. האיזורים שבהם התחלואה נמוכה מוקפים במסגרת סגולה (קצת קשה לראות):

אני לא רואה שום תבנית בפיזור של איזורי התחלואה הגבוהה על המפה, וגם לא בפיזור של איזורי התחלואה הנמוכה ((ניתן גם לבדוק את טיב ההתאמה של מודל ההתפלגות הפואסונית לנתונים)) . זה לא אומר שלא צריך לבדוק מה קורה שם. אבל הבדיקה צריכה להיות רצינית ולא להסתמך על פניקה שמפיצה כתבה בעיתון.

ראו גם רשימות נוספות שכתבתי על ההתפלגות הפואסונית ושימושיה:

נשלח: 27 בפברואר, 2019. נושאים: בריאות, מה אומרת הסטטיסטיקה, ספקנות.
תגובות: 8 | טראקבק

חיסוני חצבת ואלימות נגד נשים

בשבוע שעבר תלו הורים באחד מגני הילדים (בגבעתיים נדמה לי) שלטים על שער הגן בו הזהירו כי בגן יש ילדה לא מחוסנת והתריעו על סכנת הדבקות . אפשר להתווכח על השלט, תוכנו, וגם על הסגנון. בדיון בפייסבוק נטען כי זו "פעולה אלימה מאוד". לעומת זאת נטען באותו דיון גם כי " זו התנהגות סבירה לחלוטין… בירושלים בה יש התפרצות חצבת כרגע, יש שלטים בכניסה לקופות החולים שמזהירים הורים שילדיהם חשודים בהידבקות בחצבת מפני כניסה למרפאה ומבקשים להישאר בחוץ ולקרוא לאיש צוות שייצא אליהם, ובצדק גמור". אני באופן אישי חושב שצריך להזהיר את הציבור ובפרט הורים לילדים בגן על המצאות ילדה שלא חוסנה ביודעין, בייחוד כשבארץ יש כעת , ונכון למועד כתיבת שורות אלה למעלה מ-2000 איש אובחנו כחולים, ורבים עוד יותר נחשפו למחלה בבתי ספר, קופות חולים ובתי חולים, בתחבורה הציבורית ובמקומות נוספים.

בכל מקרה, אני לא חושב שהצבת שלטי אזהרה מפני ילדה לא מחוסנת שקולה (או למעשים אחרים שנעשו ), אבל אבישי מתיה חושב שכן ומזהיר כי "זה ייגמר בדם":

אבל בוא נעזוב את אבישי מתיה ונדון בסטטיסטיקה.

בואו נראה קודם מה יכול לקרות בגן. לכאורה אין בעיה. הילדה לא מחוסנת, ולכן הדבר הגרוע ביותר שיכול לקרות הוא שהיא תידבק בחצבת, וזו עיקר הבעיה שלה. היא עלולה להדביק אנשים אחרים שלא מחוסנים, ובגן כל הילדים האחרים מחוסנים, אז הם לא יידבקו.

זהו, שלא.

בואו נניח כי בגן הספציפי הזה יש 30 ילדים, ואף אחד מהם אינו במצב בריאותי שלא איפשר לו לקבל חיסון. כולם קיבלו חיסון. האם כולם מחוסנים? לא בהכרח. היעילות של החיסון, לאחר קבלת מנה אחת של חיסון, היא בערך 95%. אחרי קבלת המנה השנייה היעילות עולה ל-99%, אבל המנה השנייה ניתנת רק בכיתה א, והילדים האלה עדיין בגן. הסיכוי שילד אחד שקיבל חיסון אכן מחוסן הוא לכן 0.95. הסיכוי ששני ילדים אחד שקיבל חיסון הינם אכן מחוסנים הוא 0.95 כפול 0.95. הסיכוי כי כל 30 הילדים בגן שקיבלו חיסון אכן מחוסנים הוא 0.95 מוכפל בעצמו 30 פעמים, וזה יוצא 0.215. מכאן שהסיכוי כי בגן הזה יש לפחות ילד אחד שאינו מחוסן למרות שקיבל חיסון הוא כמעט 80%. הסיכוי שבקרב כל האנשים שנמצאים בסביבתה של הילדה הלא מחוסנת יש לפחות אדם אחד לא מחוסן הוא הרבה יותר גבוה. אם הילדה הזאת תחלה, כמעט בטוח שהיא תדביק אדם נוסף אחד לפחות. ככה המגיפות מתפשטות.

חצבת היא אחת המחלות המדבקות ביותר שיש, ויש אומרים כי זו המחלה המידבקת ביותר. באוכלוסייה שאיננה מחוסנת, אדם חולה ידביק בממוצע 18 אנשים נוספים. הסיכוי כי אדם לא מחוסן שנחשף לחצבת יחלה במחלה עולה על 90%. חשיפה למחלה כוללת המצאות במקום שבו היה אדם חולה חצבת אפילו שעתיים לאחר שהחולה עזב את המקום. לדעתי האישית, זה השיקול היחיד שצריך לקבוע. כמו שאף אדם מוסרי לא ידחוף דחיפה קטנה מישהו שעומד על הרציף ויש סיכון, קטן אך חיובי, שהנדחף ייפול אל מתחת לגלגלי הרכבת, אני חושב שאף אדם מוסרי לא צריך לאפשר אפילו סיכון קטן של הדבקת אדם אחר בחצבת. המעשה המוסרי הוא לצמצם את הסיכון. לכן, לא לחסן ילדים מתוך אידאולוגיה זה מעשה לא מוסרי, כי זה מסכן גם את הילד שלא מחסנים וגם אחרים, וחיסון מקטין מאוד את הסיכון הזה. להזהיר אנשים מפני סיכון של הדבקות בחצבת, גם אם הסיכון קטן, זה לדעתי המעשה הנכון והמוסרי. ((הערה: בפיסקה זו יש בעיקר דיון מוסרי, והדברים שכתבתי בפיסקה זו היו בדיון המקורי תשובה לשאלה סטטיסטית על סיכויי ההדבקות המחלה. ניתן לטעון נגד ההיסחפות שלי לדיון מוסרי, אולם אני חושב שאי אפשר לדון בשאלה הסטטיסטית בלי להידרש למשמעות המוסרית שלה.))

בשלב זה נטען כי ההסתברות שציינתי (מעל 90%) היא הסתברות מותנה, וזה נכון. זו אכן ההסתברות המותנה להדבקות בהינתן חשיפה לאדם חולה. ניתן כנגדי כי ההסתברות הרלוונטית היא "הסיכוי במצב נתון, בחיים נורמליים ורגילים בחברה הישראלית, להידבק". אני לא אחזור כאן על כל הטיעונים שנטענו ((תוכלו לקרוא זאת בדיון בפייסבוק)) ,אבל השורה התחתונה של הטיעון היא כי הסיכון להדבקות בחצבת הוא הוא "נמוך. מאד. קטנטנן."

אולם אני חושב בכל זאת שההסתברות הרלוונטית היא ההסתברות המותנה. כאן עשיתי אנלוגיה לרצח נשים. אני רוצה להבהיר כי אין בכוונתי לרמוז כי הנושא הזה אינו מטריד את האדם שהתדיין מולי, ובוודאי שאיני שם מילים בפיו. אני כן טוען כי ההסתברות הלא מותנה אינה רלוונטית כאשר דנים בסיכונים מהסוג שלי.

הטיעון שלי הוא כזה: השנה נרצחו יותר מ-20 נשים. הבה נעגל את המספר ל-30. בישראל יש קרוב ל-9 מיליון תושבים, כמחציתם, כלומר כ-4.5 מיליון הן נשים. הבה נעגל את המספר הזה ל-4 מיליון. כעת נבצע פעולת חילוק, ונקבל כי הסיכוי של אישה להירצח, עם עוד עיגול נדיב כלפי מעלה, הוא כ-1 ל-130 אלף. סיכוי הרבה יותר קטן מהסיכוי להידבק בחצבת ((שהוא כ-1 ל-4500, על פי הנתון הנוכחי של כ-2000 חולים באוכלוסייה של כ-9 מיליון איש)). אז לא צריך לעשות כלום בנושא???

אחת המשתתפות בדיון לקחה את הטיעון הזה עוד יותר רחוק ואמרה כי "הסתברות להיפגע בפיגוע טרור היא נמוכה מאוד מאוד…השנה נרצחו בפיגועי טרור 15 איש… אז אולי בכלל אין צורך לנקוט בפעולות כאלה חריפות למלחמה בטרור, ממילא מההסתברות לפגיעה היא נורא נמוכה".

אני חושב שהנקודה ברורה. בסיכונים צריך לדון בהקשר של גורמי סיכון, וההסתברות הרלוונטית היא לכן ההסתברות המותנה בגורמי הסיכון. כדי לנהל את הסיכונים צריך לטפל בגורמי הסיכון. במקרה של מגיפת החצבת, גורם הסיכון היחיד שניתן לטפל בו כרגע אופן ההתפשטות המהיר של המחלה. הדרך היחידה האפשרית להאט את קצב התפשטות המחלה היא לחסן את האוכלוסייה.

ויש עוד נקודה שצריך לשים לב אליה. אף אחד לא מטיף לרצח נשים, אבל יש עשרות אלפי אנשים שמקדמים אג'נדה אנטי חיסונית, והתנועה הזו צוברת תאוצה ועלולה להגיע למסה קריטית מסוכנת (והסיכוי שזה יקרה הוא לדעתי מאוד לא זניח). לצערי, לא קיימות כרגע סנקציות שאפשר לנקוט נגד אנשים שאינם מחסנים את ילדיהם ואנשים המעודדים אנשים אחרים לא לחסן. מה שניתן לעשות זה להזהיר מפני הסכנות, גם אם זה פוגע ברגשותיו של אבישי מתיה.

נשלח: 21 בדצמבר, 2018. נושאים: בריאות, מה אומרת הסטטיסטיקה, ניהול סיכונים, על סדר היום.
תגובות: 2 | טראקבק

שגעון הפווארבול

שגעון הפאוורבול בארצות הברית הגיע השבוע לשיאים חדשים, לאחר שבהגרלות שנערכו ב-20.10.2018 איש לא ניחש נכונה את המספרים שעלו בגורל. הפרס הגדול, נכון לעכשיו, הוא 2.22 מיליארד דולר. אני בטוח שאתם רוצים לזכות בפרס הזה. אני רוצה לזכות בפרס הזה.

מה הסיכויים לזכות בפרס הגדול בפווארבול?

למעשה מדובר בשתי הגרלות שונות. בהגרלת המגה-מיליון הפרס הגדול הוא 1.6 מיליארד דולר, וההסתברות לזכייה בו היא בערך 1 ל-302 מיליון. בהגרלה השנייה, היא הגרלת הפווארבול, הפרס הגדול הוא "רק" 620 מיליון דולר, וההסתברות לזכייה בו היא קצת יותר גבוהה – 1 ל-292 מיליון.

כדי לזכות ב-2.2 מיליארד דולר, צריך לזכות בפרס הגדול של שתי ההגרלות, שהינן כמובן בלתי תלויות זו בזו. הסיכוי לכך הוא מכפלת הסיכויים לזכייה בשתי ההגרלות בנפרד, והוא בערך שווה ל-1 ל-88000000000000000.
צריך לזכור כי למרות שההסתברות לזכייה בפרס הגדול, בייחוד אם קונים רק כרטיס אחד, היא נמוכה מאוד, היא עדיין חיובית, כלומר יש סיכוי לזכות. מי שלא קנה כרטיס, לא יוכל לזכות. לכן, הצעד הראשון בדרך לזכייה הוא לקנות כרטיס.

האם קניית כרטיס הגרלה היא השקעה טובה?

זה תלוי כמובן בשאלה איך מגדירים האם השקעה היא טובה. אפשרות אחת היא להעריך את ההחזר הצפוי על ההשקעה. בואו לא נהיה חמדניים, ונתרכז רק בהגרלת המגה-מיליון ובפרס של 1.6 מיליארד דולר. מחיר כל כרטיס הוא שני דולר. בממוצע, מי שקונה כרטיס זוכה ב-1.6 מיליארד דולר בהסתברות של 1 ל-302 מיליון, או מפסיד 2 דולר בהסתברות כמעט קרובה ל-1. לכן ההחזר הממוצע על הכרטיס הוא בערך 1.6 מיליארד כפול 1 חלקי 302 מיליון פחות 2. זה יוצא בערך 3.30 דולר. למעשה חישבתי כאן את תוחלת הזכייה של כרטיס הגרלה. שימו לב כי התוחלת חיובית. בממוצע, מפעל ההגרלות מפסיד בהגרלה הזו 3.30 דולר על כל כרטיס שנמכר. בדרך כלל, במשחקי הימורים תוחלת הזכייה היא שלילית. למשל, אם אתם מהמרים ברולטה על ניחוש שחור/אדום, תוחלת הזכייה שלכם על כל דולר הימור היא בערך מינוס 5.2 סנט, כלומר בממוצע אתם מפסידים 5.2 סנט בכל פעם שאתם מהמרים על דולר. זה מספיק לקזינו כדי להרוויח מיליונים.

ראיתי במספר פורומים (בדיונים על הגרלות אחרות עם פרסים גדולים במיוחד) אנשים שטענו כי תוחלת הזכייה חיובית ולכן כדאי לקנות כרטיס השתתפות בהגרלה. למרבה הצער הטענה הזו לא נכונה. אותם 3.30 דולר שחישבתי למעלה הם תוחלת של כסף, ותוחלת של כסף זה לא כסף. אתם לא יכולים לקחת כרטיס להגרלה שתיערך מחרתיים ולשלם איתו במכולת, גם אם תוחלת הזכייה חיובית (( נסו ותיווכחו )). מה שיקרה זה שמועד ההגרלה יגיע, ואז תזכו, או שאולי לא. כמובן, אם תוכלו להשתתף בהגרלות כאלה כמה פעמים שתרצו, משתלם לגמרי לקנות כרטיס ועוד כרטיס ועוד כרטיס. חוק המספרים הגדולים יהיה לצידכם. אבל זה לא יקרה כמובן. ההזדמנות להשתתף בהגרלה היא חד פעמית

אבל הסיכוי לזכות כל כך קטן – ברור שאין זוכה

אמנם הסיכוי שאתם תזכו בהגרלה הוא מאוד נמוך, אך הסיכוי שמישהו יזכה בפרס הגדול הוא גבוה למדי. (( זו למעשה בעיית ימי ההולדת )). הנה הסבר אינטואיטיבי. תחשבו על קובייה. אם תטילו אותה הסיכוי שתוצאת ההטלה תהיה 6 היא 1 ל-6. אם שני אנשים יטילו כל אחד קובייה, הסיכוי שלפחות באחת ההטלות התוצאה תהיה 6 הוא גבוה יותר – בערך 1 ל-3.3. אם שלושה אנשים יטילו כל אחד קובייה, הסיכוי שלפחות באחת ההטלות התוצאה תהיה 6 הוא אפילו גבוה יותר – בערך 1 ל-2.37. וכן הלאה. אפשר לחשוב על כרטיס הגרלה כמין קובייה מטאפורית, כזו שהסיכוי לתוצאת 6 אם תטילו אותה הוא 1 ל-302 מיליון. אם יותר אנשים יטילו יותר קוביות, כלומר אם יותר כרטיסי הגרלה יימכרו, הסיכוי שתתקבל תוצאת 6, כלומר שמישהו יזכה בפרס, הולך וגדל.

כמה כרטיסים צריכים להימכר כדי שהסיכוי שלפחות כרטיס אחד יזכה יהיה 5%? 10%? 50%? מה הסיכוי ששני זוכים יחלקו את הפרס הגדול? אם אתם יודעים את מספר הכרטיסים שנמכרו, אתם יכולים לחשב את הסיכויים האלה בעזרת התפלגות פואסון. אדלג ברשותכם על הפרטים הטכניים. אפשר גם לעשות חישוב הפוך, ולחשב כמה כרטיסים צריכים להימכר כדי שההסתברות שמישהו יזכה בפרס הגדול תהיה שווה ל-50%. המספר הזה הוא בערך 210 מיליון. זה לא מספר מופרך. לפי הדיווח הזה, כ-226 מיליון כרטיסים צפויים להימכר לקראת ההגרלה הקרובה.

מה אם קונים את כל הכרטיסים?

הנה עוד רעיון שבוודאי עבר במוחו של מישהו: יש 302 מיליון צירופי מספרים אפשריים. אם נקנה 302 מיליון כרטיסים, ובכל כרטיס יופיע צירוף מספרים אחר, אז הכרטיס הזוכה חייב להיות בין הכרטיסים שקנינו. כל כרטיס עולה שני דולר, אז 302 מיליון כרטיסים יעלו 604 מיליון דולר. הפרס הגדול הוא 1600 מיליון דולר, ולכן מובטח רווח של כמעט מיליארד דולר. האם אפשר לעשות את זה?

התשובה הקצרה היא "כן". התשובה הארוכה היא "כנראה שלא".

מבחינה חוקית זה אפשרי, וזה כבר נעשה לפחות פעם אחת. בשנת 1992 הפרס הגדול בהגרלת הלוטו של מדינת וירג'יניה היה 27 מיליון דולר, והסיכוי לזכייה היה בערך 1 ל-7 מיליון. כל מה שצריך היה לעשות זה לקנות 7 מיליון כרטיסים ב-7 מיליון דולר ולגרוף רווח של 20 מיליון דולר. קבוצה של כ-2500 משקיעים התארגנה לגייס את הכסף ולרכוש את הכרטיסים. למרבה צערם הם הספיקו לקנות רק כ-5 מיליון כרטיסים עד מועד ההגרלה. לאחר קצת כסיסת ציפורניים התברר שהם אכן הצליחו לרכוש את הכרטיס הזוכה, מדינת וירג'יניה ניסתה להערים קשיים משפטיים כדי להימנע מתשלום, אך בסופו של דבר סכום הפרס הגדול שולם (וגם עוד כמה עשרות אלפי פרסים יותר קטנים). ((לפרטים נוספים ראו את ספרו של דייויד הנד The improbability Principle ))

בהגרלת המגה מיליון זה סיפור בסדר גודל אחר לגמרי. קודם כל, כדי לקנות 302 מיליון כרטיסים צריך 604 מיליון דולר, במזומן. שנית, יש לכם רק ארבעה ימים עד ההגרלה הבאה. בארבעה ימים יש 345600 שניות, כלומר תצטרכו לקנות כמעט 900 כרטיסים בכל שניה. וכמובן, אתם צריכים לוודא איכשהו שקניתם 302 מיליון כרטיסים שונים.

נניח שעשיתם את כל זה וזכיתם. הפרס משולם לזוכה ב-30 תשלומים שנתיים. מי שרוצה כסף עכשיו ומייד, יקבל רק 57% מהסכום. צריך גם לשלם מס בסך 25%. מ-1.6 מיליארדי הדולרים יישארו רק 684 מיליון. עדיין רווח נקי של 80 מיליון דולר תוך ארבעה ימים. לא רע.

אבל… כל זאת, כמובן, אם לא יהיה זוכה נוסף בפרס הגדול.

וההסתברות שיהיה זוכה נוסף או אפילו יותר אינה זניחה. כבר ראינו כי אם נמכרים עוד כ-200 מיליון כרטיסים מלבד 302 מיליון הכרטיסים שלכם, ההסתברות כי יהיה זוכה אחד נוסף לפחות היא כ-50%. אם יהיה זוכה אחד נוסף, החלק שלכם בפרס יהיה רק 800 מיליון דולר, שלאחר ההיוון ותשלום המס יתכווצו ל- 342 מיליון, וזה כבר הפסד נקי של 262 מיליון דולר. אם הפרס יתחלק בין שלושה זוכים ההפסד יהיה גבוה יותר. לא טוב. אם היו לכם 604 מיליון דולר, האם הייתם מוכנים לקחת את הסיכון?

האם כדאי לקנות כרטיס?

אני חושב שכן. אם הייתי תושב ארצות הברית הייתי קונה כרטיס. אחד. זה שעשוע נחמד ויש סיכוי כלשהו לזכות. היכן עוד תוכלו לקנות תקווה תמורת שני דולר בלבד? (( פראפרזה על דברים שאמרו פרופ' צבי גילולה ופרופ' ישראל אומן))

נשלח: 22 באוקטובר, 2018. נושאים: הימורים, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

ניתוח השפעה של אירוע על נתונים לאורך זמן – Interrupted Time Series

בפוסט קודם ניתחתי מה קרה לשיעורי תאונות הדרכים בישראל בתקופת כהונתו של ישראל כץ כשר התחבורה.

כדי לענות על שאלות גון אלה – מה קורה לתופעה כזו או אחרת לאורך זמן – מומלץ להשתמש בשיטות סטטיסטיות לניתוח סדרות עיתיות (Time Series). סדרה עיתית היא סדרה של נתונים שנאספים לאורך זמן: שבועות, חודשים ואפילו שנים. ניתן גם לבדוק את השפעתו של שינוי מסויים שחל במהלך הזמן (המהווה הפרעה למגמת הסדרה), כמו שינוי קיצוני במזג האוויר, כניסת מתחרה חדש לשוק, או מינוי של שר, בעזרת טכניקה הנקראת "ניתוח סדרות עיתיות מופרעות", או באנגלית Interrupted Time Series או פשוט ITS.

ברשימה זו אסביר את הרעיונות המרכזיים של שיטת ה-ITS שבעזרתה ניתחתי את נתוני תאונות הדרכים בישראל.

דוגמה: החזרי הוצאות עבור רכישת תרופות אנטי פסיכוטיות למבוטחי מדיקייד במערב וירג'יניה

תכנית מדיקייד היא תכנית ביטוח ממשלתית לבעלי הכנסות נמוכות בארצות הברית, ובין היתר משתתפת בהוצאות לרכישת תרופות של המבוטחים. בתחילת שנות ה-2000, כאשר נכנסו לשוק תרופות אנטי פסיכוטיות מהדור השני, שהן גם יקרות יותר, חלה עלייה משמעותית בהחזרי התשלומים עבור התרופות האנטי פסיכוטיות, כיוון שכ-50% מהמרשמים היו לתרופות מהדור השני. רשויות המדינה אינן יכולות, כמובן, לאסור על הרופאים לרשום לחולים תרופות מסויימות. במדינת מערב וירג'יניה החליטו להתחכם ולהוסיף ביורוקרטיה. החל מאפריל 2003, רופא במדינה שרצה לרשום לחולה שמבוטח במדיקייד תרופת דור שני, היה צריך למלא טופס. הנה גרף המראה את אחוז המרשמים של תרופות דור שני מתוך סך המרשמים לתרופות אנטי פסיכוטיות לאורך זמן, כאשר הקו האנכי המקווקו מסמן את המועד בו הונהגה חובת מילוי הטופס: (( מקור: Law , Ross-Degnan and Soumerai SB, Effect of prior authorization of second-generation antipsychotic agents on pharmacy utilization and reimbursements, Psychiatr Serv. 2008 May;59(5):540-6. ))

ברור לחלוטין שמשהו קרה, אבל הסטטיסטיקה יכולה לתת לנו מבט יותר מעמיק.

הרעיון הוא מאוד פשוט – נעביר שני קווי רגרסיה: קו אחד יותאם לנתונים שלפני השינוי, וקו אחר לנתונים לאחריו (( היישום קצת פחות פשוט, ומייד אפרט למי שמעוניין )). הנה הגרף עם קווי הרגרסיה:

כעת ניתן לראות כמה דברים. ראשית, אחרי ההתלהבות הראשונית נראית מגמה של ירידה, אמנם איטית מאוד, באחוז המרשמים לתרופות דור שני. כמובן שיש לבדוק האם ירידה זו היא מובהקת סטטיסטית (היא לא) ולקבוע האם היא משמעותית (כנראה שלא, אחרת לא היה צריך להפעיל את מדיניות הטופסולוגיה).

שנית, אנו רואים מין ירידת מדרגה קטנה בין הרבעון האחרון שלפני הנהגת המדיניות החדשה והרבעון הראשון לאחר הנהגתה. שוב, ניתן וצריך לבדוק האם זוהי ירידה מובהקת (היא כן) ומשמעותית (לא ברור).

שלישית, ברור לחלוטין שהנהגת המדיניות הביאה לירידה משמעותית ומובהקת באחוז המרשמים לתרופות דור שני.

הקו הירוק מראה את ה-counterfactual, תרחיש ה-"מה היה קורה אילו" לא הונהגה מדיניות מילוי הטפסים. את הצלחת המדיניות מודדים על ידי ההבדל (המוחלט או היחסי) בין מה שקרה בפועל ובין ה-counterfactual.

המודל הסטטיסטי

הדבר הראשון שיש לשים אליו לב הוא שבניגוד למודל רגרסיה רגיל, הנתונים כאן אינם בלתי תלויים אחד בשני. בנתונים של סדרות עיתיות יש בדרך כלל קשר סטטיסטי בין הנתון של נקודת זמן מסויימת והנתון של נקודת הזמן הבאה, ואולי אפילו לנתונים של נקודות זמן רחוקות יותר.התופעה הזאת נקראת אוטוקורלציה. לכן, לפני שמריצים מודלים של רגרסיה, צריך לחקור את הקשרים בין הנתונים לאורך זמן. ברשותכם לא אכנס לפרטים, אך אציין כי קשרים אלה נלקחים בחשבון בהמשך הניתוח.

כמון כן, ציינתי קודם שמעבירים שני קווי רגרסיה, אך אומדים אותם במודל אחד, בן ארבעה פרמטרים: הפרמטר הראשון הוא הגובה בו מתחילה סדרת הנתונים ("החותך"). הפרמטר השני הוא השיפוע, כלומר המגמה, של הנתונים לפני נקודת השינוי. הפרמטר השלישי הוא הקפיצה או הפער בין הנקודה אליה הגיעה הסדרה ממש לפני השינוי ובין הנקודה הראשונה אחרי השינוי. הפרמטר האחרון הוא הרבה פחות אינטואיטיבי: זהו ההפרש בין המגמה של הנתונים לפני השינוי והמגמה שלאחר השינוי. השרטוט הבא מנסה להבהיר את המשמעות של ארבעת הפרמטרים ((השרטוט נלקח מהשקפים של הקורס Policy Analysis using Interrupted Time Series שזמין ברשת באתר edX))

לאחר שאומדים את הפרמטרים של המודל אפשר לבדוק בעזרת שיטות סטנדרטיות האם השינויים הם מובהקים, וכן להעריך האם הם גם משמעותיים.

נשלח: 27 ביולי, 2018. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 1 | טראקבק

איך חוזים תוצאה של מונדיאל?

עכשיו, כשנאלמה תרועת הפסטיבלים והמונדיאל הסתיים, זה זמן טוב לדבר על כל המודלים שסיפקו תחזיות מונדיאל ועל מודלים של תחזיות בכלל.

ברשימה זו אסקור את הבסיס למודלים שניסו לחזות את תוצאות המונדיאל, ומשם אעבור לדיון בחלק מהתכונות של מודלים לחיזוי, במשמעות של החיזוי ובמגבלות של המודלים האלה.

איך חוזים תוצאה של מונדיאל?

הסקירה הזו מתבססת בחלקה על המאמר הזה שפורסם באקונומיסט לפני פתיחת המונדיאל של 2018 ((תודה לצליל אברהם שהפנתה את תשומת ליבי אליו)).

כדי לחזות את התוצאה של המונדיאל (או כל טורניר ספורט אחר) יש צורך במספר שלבים. ראשית, צריך לדרג באופן כלשהו את הנבחרות/קבוצות המשתתפות בטורניר ואת הבדלי הרמות ביניהן. בשלב השני צריך לספק הערכה/חיזוי לתוצאות של משחקים ספציפיים ((גרמניה מול מקסיקו, מישהו? תיכף נדבר על זה)), ובשלב השלישי לנסות לחזות על סמך החיזויים של תוצאות המשחקים את המנצחת הסופית. המאמר שפורסם באקונומיסט מתעמק בעיקר בשלב הראשון.

שלב ראשון: דירוג הנבחרות

יש שתי דרכים לדרג את האיכות של נבחרת או קבוצת ספורט: על ידי הערכת ביצועי הקבוצה, או על ידי הערכת ביצועי השחקנים.

להערכת ביצועי הקבוצה משתמשים בעיקר במודלים מסוג Elo , מודל שפותח במקור עבור משחק השחמט. הרעיון הוא שכל קבוצה מקבלת ניקוד על כל משחק שהיא שיחקה, אבל בניגוד לליגה או לטורנירים שבהם מקבלים 3 נקודות על כל ניצחון, לא משנה באיזה משחק, ב- Elo הניקוד משתנה בהתאם ליריבה, מיקום המשחק, חשיבותו, וכדומה. אם למשל גרמניה מנצחת את סעודיה במשחק ידידות שנערך בלוורקוזן, הניצחון הזה לא שווה הרבה נקודות, כי היריבה נחותה, המשחק לא ממש חשוב, וגרמניה שיחקה במגרש הביתי. לעומת זאת, ניצחון על ברזיל, במשחק שנערך בברזיל, במסגרת חצי הגמר של המונדיאל, שווה הרבה מאוד נקודות. יש כל מיני וריאציות למודל, מה שמסביר חלק מההבדלים בניבויים השונים. למודלים שונים יש מפתח נקודות שונה, ויש גם מודל שנותן ניקוד לא על פי תוצאת המשחק אלא על פי מספר השערים שהובקעו, וכך ניצחון בתוצאה 7:1 שווה הרבה יותר מניצחון 1:0. כמו כן, צריך להחליט על איזה אופק זמן מסתכלים. יכול להיות משחק ששוחק במונדיאל מקסיקו 70 או אפילו בדרום אפריקה ב-2010 כבר לא ממש משמעותי. עם זאת, באחת הכתבות תואר מודל שלקח בחשבון את כל התוצאות מאז המונדיאל הראשון שנערך ב-1930. אני מניח שהמודלים משקללים את המשמעות של כל משחק בהתחשב בזמן שעבר.

הדרך השנייה היא להעריך כל שחקן לחוד, ואז לקבל הערכה של הקבוצה כסך כל שחקניה. יש כל מיני דרכים לעשות את זה. אפשר למדוד את הביצועים של כל שחקן בכל משחק (כמה מסירות טובות הוא מסר, כמה תיקולים מוצלחים וכדומה). לדעתי צריך לקחת בחשבון גם פעולות שהשחקן לא עשה ואולי היה צריך לעשות (לא ברור לי אם יש בכלל נתונים כאלה). כמו כן, יש דברים ששחקנים תורמים לקבוצה ולא ניתנים למדידה – מנהיגות למשל.

דרך אחרת היא לבדוק מה היו ביצועי הקבוצה כשהשחקן שיחק בהרכב ומה הם היו כשהוא לא שיחק. בכדורגל זה פחות יעיל כי יש יחסית מעט משחקים, יש מעט חילופים, ובדרך כלל אין הרבה שינויים בהרכבים. עם זאת, זו שיטה מאוד מקובלת ויעילה בענפים כמו כדורסל ובייסבול.

ראיתי באחת הכתבות גם מודל שהכניס לשקלול את משכורות השחקנים. המודל הזה חזה שצרפת תזכה בטורניר, ואנחנו כבר יודעים שהוא צדק. זה לא בהכרח אומר שהוא מודל טוב. אם יש הרבה מודלים, אז הסיכוי שאיזשהו מודל יצדק הוא לא נמוך. זה כמו בלוטו. הסיכוי שאתה תזכה בפרס הגדול הוא קטן, אבל הסיכוי שמישהו יזכה הוא מאוד גבוה. עם זאת, אין להבין מדבריי כי אני חושב שזה מודל לא טוב. האמת היא שאי אפשר לקבוע.

אפשר גם לשקלל את את הערכת הנבחרת עם הערכת השחקנים, ויש כל מיני שקלולים: 50-50, 75-25 וכולי. זה כנראה לא כל כך משנה. לפחות לפי הנתונים שהובאו באקונומיסט, יש מתאם גבוה בין שתי שיטות ההערכה:

שלב שני: חיזוי תוצאות של משחקים

אחרי שיש לנו מדד שמעריך את האיכות של כל נבחרת, אפשר להתחיל לדבר על חיזוי תוצאות של משחקים. שוב, יש כל מיני דרכים לעשות את זה, אבל העיקרון דומה. לוקחים נתונים של המון משחקים שרלוונטיים בעינכם. אתם יכולים לקחת את הנתונים של המשחק בן גרמניה וסעודיה שנערך בלוורקוזן ביוני 2018 (גרמניה ניצחה 2:1), וגם את המשחק בין גרמניה והולנד בגמר מונדיאל 1974 (מצטער שאני משבית שמחות). לכל משחק הנתונים יכולים לכלול כל מיני פרטים שנראים חשובים למי שבונה את המודל – כגון הערכת הנבחרות לפי מודל Elo כזה או אחר, מקום משחק, חשיבותו, מסורת ניצחונות, מזג האוויר, המשכורת של השחקנים, או מספר הנעליים של השוער. אלה הם המשתנים המסבירים. לכל משחק יש גם תוצאה – זה המשתנה המוסבר, ויש שלוש תוצאות אפשריות. אפשר לשפוך את כל הנתונים לתוך אלגוריתם שמיישם מודל – רגרסיה לוגיסטית, random forest, דיפ לרנינג, מה שבא לכם.

לאחר שאמדתם את הפרמטרים של המודל (( או כמו שאנשי המשין לרנינג אוהבים להגיד – "אימנתם אותו")) ווידאתם שהוא פועל היטב גם על נתונים ששמרתם בצד ולא נכנסו למודל, אתם יכולים לקחת את הנתונים של נבחרת גרמניה ושל נבחרת מקסיקו, להפעיל עליהם את המודל שלכם, ולקבל תוצאה. התוצאה תהיה בעצם שלוש הסתברויות: ההסתברות שגרמניה תנצח במשחק, ההסתברות שמקסיקו תנצח, וכמובן גם את ההסתברות שהמשחק יסתיים בתיקו. חשוב לזכור שאלה לא הסתברויות "אמיתיות". אלה הם אומדנים להסתברויות, שקיבלתם מהמודל שלכם, והם מתבססים על כל ההנחות שהנחתם בדרך.

שלב שלישי: חיזוי מהלך הטורניר

עכשיו מתחיל הכיף האמיתי. אני מניח שכל מודל שהוא שניסה לחזות את תוצאת המשחק בין מקסיקו לגרמניה נתן הסתברות גבוהה לניצחון של גרמניה, הסתברות יותר נמוכה לתיקו, ולניצחון של מקסיקו ניתנה ההסתברות הנמוכה ביותר. אבל דברים יכולים לקרות (ואכן קרו). מה עושים? סימולציה.

נניח לצורך הדוגמה שההסתברויות שהפיק המודל היו 70% לניצחון גרמניה, 20% לתיקו, ו-10% לניצחון מקסיקו. שמים בתוך שק 10 כדורים: 7 לבנים, 2 ירוקים, וכדור שחור אחד. מערבבים טוב טוב את הכדורים ומוציאים כדור אחד. אם הוא לבן, נגיד שגרמניה "ניצחה", אם הוא ירוק נגיד שהמשחק "הסתיים בתיקו", ואם הכדור שהוצאנו הוא שחור נגיד שזה היה יום שחור לגרמניה. אפשר לעשות את זה גם בעזרת מחשב כמובן.

צריך לזכור שבבית שבו שיחקו גרמניה ומקסיקו היו עוד שתי נבחרות ובסך הכל שוחקו בו שישה משחקים. אז עושים את התרגיל הזה לכל אחד מששת המשחקים, וכשיש לנו את כל תוצאות המשחקים שהתקבלו בסימולציה, מקבלים את טבלת הבית, ואת שתי הנבחרות שעלו לשלב הבא.

את התרגיל הזה עושים לכל הבתים בשלב המוקדם, ובסיומו "נדע" מי הן 16 הנבחרות שעלו לשמינית הגמר, ואיזה נבחרת תשחק מול איזה נבחרת. את התוצאות של המשחקים אנחנו יכולים לחזות באותו אופן, ומשם "נדע" מה יהיו משחקי רבע הגמר וכך הלאה. בסופו של כל התהליך נקבל את הזוכה.

כל התוצאות שקיבלנו מתבססות של הגרלות ושליפה וירטואלית של כדורים מתוך שקים. אם נבצע שוב את התהליך מההתחלה, סביר להניח שנקבל תרחיש אחר ותוצאה שונה. נו פרובלם. נחזור על התרגיל הזה המון פעמים, 10000 נניח, או מיליון, ונחשב איזשהו ממוצע של כל התרחישים שהגרלנו. למשל, אם ב-900 מתוך 10000 תרחישים קיבלנו שגרמניה זכתה בסופו של דבר, נאמוד את הסיכוי שגרמניה תזכה במונדיאל ב-900 חלקי 10000 שהם 9%. החיזוי האולטימטיבי של הזוכה במונדיאל הוא הנבחרת שניצחה ברוב התרחישים מבין ה-10000.

אם המודל שממנו התחלנו הוא מודל טוב, והנתונים שבהם השתמשנו כדי לאמוד את הפרמטרים של המודל הם נתונים טובים, אז גם התחזיות יהיו טובות. אבל…

נקודת תורפה: הנחת אי-תלות

אבל יש כאן בעיה גדולה: כל מה שתואר עד כאן מניח שהמשחקים בלתי תלויים, והם לא. תוצאה של משחק אחד בהחלט יכולה להשפיע על תוצאה של משחק אחר. אם למשל, נבחרת הבטיחה את עלייתה לשמינית הגמר אחרי שני משחקים, ייתכן כי השחקנים החשובים, הכוכבים, יקבלו מנוחה, כי אין טעם להשקיע מאמצים במשחק שלא משנה כלום. אירוע כמו פציעה של שחקן במשחק בהחלט יכול להשפיע על המשחק הבא. קבוצה שהשקיעה הרבה מאוד מאמץ כדי לנצח בשמינית הגמר (הארכה, יריבה קשה במיוחד) תגיע מותשת יותר למשחק הבא, ויד עוד הרבה דוגמאות. כל המודלים לטווח ארוך (שמנסים לחזות מי תזכה בטורניר לפני שהוא התחיל) לא יכולים לקחת את כל הפרמטרים האלה בחשבון. כאן יש יתרון ברור לסוכנויות ההימורים, שיכולות לעדכן את אמדני הסיכויים ושערי ההימורים ממשחק למשחק.

למה בכלל צריך סימולציה?

בדף של הבלוג בפייסבוק, Mickey Ktv שאל את השאלה הזו: "מה המשמעות של ביצוע הסימולציה? הרי אם יש לנו הסתברות מסויימת לכל משחק, אנחנו יכולים לפי זה לחשב את ההסתברות של כל קבוצה לנצח. בגלל חוק המספרים הגדולים, תוחלת הסימולציה צריכה לצאת קרובה מאוד להסתברות שמחושבת 'ידנית'. האם זה בגלל שיותר פשוט להריץ סימולציה במחשב מאשר לחשב את ההסתברות? (למרות שבמידה שקולה ניתן לבנות מודל שמחשב את ההסתברות עצמה)"

בתיאוריה אין שום בעיה לקחת נייר ועיפרון ולחשב את כל ההסתברויות וההסתברויות המותנות. אבל הנה ההבדל בין התיאוריה והמציאות. בכל בית יש ארבע נבחרות, ולכן יש 24 אפשרויות שונות לתוצאה הסופית של טבלת הבית. אבל בואו ניתן הנחה – מה שמעניין זה מיהן שתי הנבחרות שמסיימות במקום הראשון והשני, ולכך יש רק 12 תוצאות אפשריות. פרט למקרים מאוד נדירים, לכל התוצאות האלה יש הסתברות חיובית. יש 8 בתים מוקדמים, ולכן מפר התרחישים האפשריים לשמינית הגמר הוא 12 בחזקת 8. זה יוצא קצת פחות מ-430 מיליון (429981696). אז קצת קשה לעשות את זה עם נייר ועיפרון. גם אם נכתוב תכנית מחשב שתבצע את כל החישובים, לא סביר שהיא תסיים לרוץ לפני סיום המונדיאל הבא… במקרה כזה הדרך המעשית היחידה לאמוד את ההסתברויות באופן יעיל היא בעזרת סימולציה.

מה עשו המודלים?

בטבלה שפורסמה באקונומיסט יש תחזיות של כמה מודלים. הסיכויים של ברזיל נעו בין 13 ל-32%, של גרמניה בין 5 ל-16%, של צרפת בין 5 ל-11%, ושל קרואטיה בין 1 ל-3%. שימו לב שהאחוזים בטורים לא מסתכמים ל-100%. מכאן שהמודלים האלה נתנו הסתברויות חיוביות לזכייה של נבחרות "פחות נחשבות" – אולי מצרים או קמרון.

האם המודלים האלה הצליחו או נכשלו? זה תלוי כמובן איך מגדירים הצלחה או כישלון. המודל של Goldman Sachs, למשל, נתן לצרפת הסתברות של 11% לזכות. הוא לא אמר שצרפת לא תזכה. גם מאורעות שהסתברותם 11% מתרחשים לפעמים. הוא גם נתן לברזיל הסתברות של 19% לזכות, או במילים אחרות, אמר כי יש הסתברות של 81% שברזיל לא תזכה. צדק או לא צדק? (( יש הרבה דרכים להעריך את האיכות של מודלים האופן כמותי. לא אכנס לפרטים))

על המשמעות של המודלים

הבעיה של כל המודלים לתחזיות, מכל סוג שהוא, ולכל מה שאתם רוצים לחזות, היא שהם מנסים לחזות משהו שעוד לא קרה, כלומר את העתיד. ולחזות את העתיד, כפי שציין בצדק נילס בוהר, זה קשה מאוד. ואין הבדל עקרוני בין תחזית למשחק כדורגל בודד, לתוצאה הסופית של מונדיאל שלם, למזג האוויר של מחר ((אם אתם לא בישראל, כמובן)), או לשאלה החשובה מאוד האם אני אקנה באמזון ספר שיציע לי האלגוריתם כאשר אכנס לאתר הזה בפעם הבאה. כל המאורעות האלה הם מאורעות חד פעמיים. תסלחו לי על האמירה הבוטה, אבל התחזית של המודל היא בסך הכל ניחוש אינטליגנטי (( זו לא תובנה מקורית שלי, שמעתי אותה ממורי ורבי פרופ' צבי גילולה)).

בעולם שלנו יש שונות אינהרנטית, או כמו שכתבתי למעלה, דברים קורים. מה קרה במשחק של גרמניה מול מקסיקו? קרו המון דברים, ואת רובם אנחנו אפילו לא יודעים. אולי לאחד השחקנים של גרמניה כאב הראש, ושחקן אחר סתם בא במצב רוח לא טוב, ואילו השוער של מקסיקו מאוד נהנה בארוחת הבוקר ועקב כך חש אנרגיות חיוביות. לך תדע. מצד שני, בעשרים השנים האחרונות גרמניה מנצחת באופן עקבי ולאורך זמן ב-75% מהמשחקים שלה, ולכן אני מוכן להתערב שאם גרמניה ומקסיקו יישחקו 100 משחקים, גרמניה תנצח לפחות ב-75 מהמשחקים האלה (( על איזה סכום להתערב? צריך כמובן לחשב את ההסתברות שגרמניה תנצח ב-75 משחקים לפחות אם הסיכוי שלה לנצח במשחק בודד הוא 75%)).

וזו הפרשנות שאני נותן לחיזוי – פרשנות שכיחותנית (( סטטיסטיקאים אחרים ייתנו אולי פרשנויות אחרות, ואני לא אכנס כאן לפרטים)).

לפי הפרשנות הזאת, אם אומרים לכם שמחר יש 30% סיכוי לגשם ((כמובן בהנחה שאתם לא בתל אביב אלא בלונדון )), המשמעות היא שבשלושים אחוז מהימים שדומים ליום שיהיה מחר ירד גשם. שימו לב שהפרשנות לפיה ב-30% ממשך היום יורד גשם אינה נכונה – זה כמו להגיד שברזיל תזכה ב-19% מהגביע. ואם המודל של אמזון חוזה שיש סיכוי של 20% שאקנה את הספר שהאלגוריתם מציע לי – פירוש הדבר הוא ש-20% מהאנשים שדומים לי יקנו את הספר.

ומכאן נובעת המגבלה העיקרית של כל המודלים: טיב החיזוי מוגבל על ידי כמות המאורעות. לחזות תוצאה של אירוע חד פעמי כמו המונדיאל זה קשה מאוד. אם נתחיל מחר את כל המונדיאל מחדש עם אותן הנבחרות, אף אחד לא יכול להבטיח לנו שתתקבל אותה התוצאה.

אם לעומת זאת, אנחנו מנסים לחזות תוצאות של הרבה מאורעות דומים ו/או נשנים, התחזיות הופכות להיות יותר אמינות, או כפי שאני מעדיף לומר, יותר סבירות. היו בלונדון הרבה ימים כמו מחר, וב-30% מהם ירד גשם, ולכן התחזית כי מחר יש סיכוי של 30% לגשם היא סבירה. ולאמזון יש מיליון לקוחות כמוני ((רק שלא קוראים להם יוסי לוי, ואם יש ביניהם יוסי לוי אחר, אז הוא חיקוי זול)), ואם המודל שמציע את הספר הוא מודל טוב, אז 20% מהאנשים האלה יקנו אותו, ובעלי המניות של אמזון מרוצים.

נשלח: 15 ביולי, 2018. נושאים: דטה סיינס, מה אומרת הסטטיסטיקה, ספורט.
תגובות: 2 | טראקבק