חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'מה אומרת הסטטיסטיקה'

ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד

אשה בת 50 עברה בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד, והתקבלה תוצאה חיובית.[1] עם זאת, החולה והרופאה יודעות כי הבדיקה אינה מדוייקת ב-100% ותיתכן תוצאה שגויה.

השאלון שואל איזו פרופורציה של נשים שתוצאת הממוגרפיה שלהן חיובית אכן חולות בסרטן השד, וזאת על פי נתוני ה-NHS, שירותי הבריאות הלאומיים של בריטניה. את התשובה קל למצוא בגוגל: בערך אחת מכל ארבע נשים בגילאי 50 עד 70 שנקראות לבירור נוסף עקב תוצאה שאינה שלילית באופן חד משמעי, אחת אכן חולה בסרטן השד. נתון זה נקרא ערך הניבוי החיובי של הבדיקה. פורמלית, נאמר כי ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד בקרב נשים בגילאי 50 עד 70 הוא 25%. (אני מציע שתעצרו רגע לחשוב האם ערך הניבוי החיובי של 25% הוא סביר בעיניכם. אין תשובה אובייקטיבית לשאלה הזו.)

מכאן שאם תוצאת הבדיקה חיובית, עדיין יש סיכוי של 75% בערך שהנבדקת אינה חולה. כלומר: מתוך כל ארבע נשים בגילאי 50 עד 70 שתוצאת הממוגרפיה שלהן חיובית, שלוש אינן חולות.

לנשים צעירות יותר, ערך הניבוי החיובי נמוך יותר, ולכן ארגוני הבריאות לא ממליצים לנשים מתחת לגיל 50 שאינן נמצאות בקבוצת סיכון לעבור בדיקת ממוגרפיה.

שתי הפסקאות האחרונות עשויות לעורר בכן תמיהה, ובצדק. בדיקת הממוגרפיה היא אותה בדיקה, לא משנה מה גיל האישה שעברה את הבדיקה. אז למה ערך הניבוי החיובי משתנה עם הגיל?

כדי להבין זאת דרוש תחילה הסבר קצר על בניית כלים דיאגנוסטיים כגון בדיקת ממוגרפיה לגילוי מוקדם של סרן השד, או כל בדיקה אחרת.

כאשר מפתחים בדיקה כזו, מסתמכים על נתונים אמיתיים, שבהם אנחנו יודעים גם את תוצאת הבדיקה: חיובית או שלילית, וגם את המצב האמיתי של הנבדק: חולה או בריא. למעשה, הקריטריון לפיו קובעים האם תוצאת הבדיקה חיובית או שלילית נקבע בדרך כלל על סמך המצב הרפואי של הנבדק ותוצאת הבדיקה. כך למשל, אם עורכים בדיקת דם יכולים לקבל טווח של ערכים, ואז קובעים איזשהו קו מפריד כך שהערכים הגבוהים מהקו נחשבים לחיוביים ואלה שמתחת לקו נחשבים שליליים (או להיפך) [2] . בבדיקות ממוגרפיה זה קצת יותר מסובך כי אין תוצאה מספרית, אבל העיקרון דומה.

לאחר שנקבע הקריטריון לפיו מחליטים האם תוצאת הבדיקה חיובית או שלילית, ניתן לחשב כל מיני מדדים המאפיינים את הבדיקה. שני מדדים נפוצים הם הסגוליות (specificity) והרגישות (sensitivity) של הבדיקה, והם, כאמור, מאפיינים של הבדיקה עצמה.

ערך הניבוי החיובי של הבדיקה נקבע על פי שלושה ערכים. שניים מהם הם הסגוליות והרגישות. הערך השלישי הוא ההימצאות (prevalence) של המחלה, כלומר עד כמה המחלה שכיחה באוכלוסייה הנבדקת.[3] . עם קצת אלגברה אפשר לראות כי ככל שהמחלה נפוצה יותר באוכלוסייה, כך ערך הניבוי החיובי של הבדיקה עולה.

מכאן ברור הקשר בין ערך הניבוי החיובי של בדיקת הממוגרפיה ובין הגיל של הנבדקת. בקבוצת האוכלוסייה של נשים צעירות, מתחת לגיל חמישים לצורך הדיון, מחלת סרטן השד נפוצה פחות, ולכן ערך הניבוי החיובי נמוך יותר עבור נשים צעירות יותר. מסיבה זו (ומסיבות נוספות) ארגוני הבריאות לא ממליצים על בדיקת ממוגרפיה לנשים מתחת לגיל 50 שאינן בקבוצת סיכון.

רשימה זו היא הרשימה השמינית והאחרונה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

 

 


הערות
  1. התוצאה חיובית אך המשמעות לנבדקת היא שלילית מאוד []
  2. כיצד קובעים את ערך הקו המפריד? זה נושא לרשימה אחרת []
  3. למי שמעוניין בנוסחה – הנה קישור []

מה מספר הכדורים האדומים בכד? – אמידת נראות מירבית

בכד יש 90 כדורים, חלקם אדומים וחלקם לבנים. נאמר לכם כי מספר הכדורים האדומים הוא 45 או 60 (אין אפשרות אחרת).

אתם מוציאים מהכד 300 כדורים עם החזרה, כלומר: מערבבים היטב את תכולת הכד, מוציאים כדור, רושמים את צבעו, ומחזירים אותו לכד. אחר כך מערבבים שוב את תכולת הכד, מוציאים שוב כדור, רושמים את צבעו ומחזירים אותו לכד, כך 300 פעמים.

בסך בכל הוצאתם 175 כדורים אדומים מתוך 300. מהי ההערכה שלכם לגבי מספר הכדורים האדומים בכד?

הנה התשובות שקיבלתי לחידה הזו בטוויטר:

 

בואו נעשה קצת סדר.

ראשית, לגבי הבקשה להעריך את מספר הכדורים האדומים בכד: בשפה יותר “סטטיסטית”, הבקשה היא לאמוד את מספר הכדורים האדומים בכד, ולכן אשתמש מעתה בביטויים כגון “לאמוד” ו-“אומדן”.

אם בכד יש 45 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 45 מתוך 90, כלומר חצי. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, מחציתם היו אדומים, כלומר הייתם שולפים 150 כדורים אדומים.

באופן דומה, אם בכד יש 60 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 60 מתוך 90, כלומר שני שליש. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, שני שליש מתוכם היו אדומים, כלומר הייתם שולפים 200 כדורים אדומים.

כאן אתם יכולים כבר להבין למה הנתון שנתתי לכם הוא שהוצאו 175 כדורים אדומים: 175 הוא הממוצע של 150 ו-200, כלומר אתם נמצאים באמצע הדרך בין שני העולמות המושלמים ההיפותטיים. או שלא?

בקשה שקולה לבקשה שלי היא לאמוד את ההסתברות להוציא כדור אדום מהכד: האם ההסתברות הזו היא חצי או שני שליש. אם לא הייתי אומר לכם מראש שההסתברות הזו חייבת להיות חצי או שני שליש, הייתם בוודאי אומרים כי ההסתברות היא 175 מתוך 300, כלומר 0.5833.  בסוף הפוסט הזה אסביר מדוע.

אחת הדרכים האפשריות לאמוד את מספר הכדורים האדומים בכד, או באופן שקול, לאמוד את ההסתברות להוציא כדור אדום מהכד היא להניח שאם ראינו משהו, זה אומר שההסתברות שנראה את אותו משהו גבוהה. העיקרון הזה נקרא עיקרון הנראות המירבית.[1]

נדגים את העיקרון בעזרת דוגמא יותר קיצונית. נניח ששלפתם 300 כדורים מהכד וכל הכדורים שנשלפו היו אדומים. אם בכד היו 45 כדורים אדומים, אז ההסתברות למאורע הזה היא חצי בחזקת 300. אם בכד היו 60 כדורים אדומים, ההסתברות לשלוף 300 כדורים אדומים היא שני שליש בחזקת 300. לא צריך לדעת הרבה מתמטיקה כדי לדעת שחצי בחזקת 300 הרבה יותר קטן משני שליש בחזקת 300. לכן, אם הוצאתם 300 כדורים אדומים, האפשרות הסבירה יותר היא שיש בכד 60 כדורים אדומים, וזה יהיה האומדן שלכם למספר הכדורים האדומים בכד.

ההמשך ברור: יש לחשב את ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 45 כדורים אדומים, ואת ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 60 כדורים אדומים. אם ההסתברות הראשונה יותר גבוהה, אז האומדן שלכם יהיה 45. אם ההסתברות השנייה תהיה יותר גבוהה, אז האומדן שלכם למספר הכדורים האדומים יהיה 60.

את שתי ההסתברויות האלה אפשר לחשב על ידי נוסחת ההתפלגות הבינומית. אל תטרחו לנסות. רוב הסיכויים הם שהמחשב שלכם לא יצליח לחשב את ההסתברויות האלה באופן מדוייק. אפשרות שניה היא לנסות לחשב את ההסתברויות האלה על ידי הקירוב הפואסוני להתפלגות הבינומית. הסברתי זאת בעבר כאן בבלוג, ראו למשל את הדוגמה הזו לחיזוי מספר הזוכים בלוטו.

אבל הדרך הכי קלה ומהירה היא לחשב את היחס בין שתי ההסתברויות[2]. מספרים שצריך לחשב בדרך, כמו 300 עצרת (מספר בן 615 ספרות) יצטמצמו, ולבסוף תקבלו כי ההסתברות להוציא 175 כדורים אדומים כאשר יש בכד 45 כדורים אדומים גדולה פי 1.4 מההסתברות להוציא  להוציא 175 כדורים אדומים כאשר יש בכד 60 כדורים אדומים. לכן האומדן שלי למספר הכדורים האדומים בכד הוא 45.

אומדן זה הוא אומדן נראות מירבית. הגעתי אליו על ידי כך שחישבתי את ההסתברות לקבל 175 כדורים אדומים בשני המצבים האפשריים, ובחרתי במצב שבו ההסתברות להוציא 175 כדורים אדומים הייתה גבוהה יותר.

מה היה קורה אילו לא אמרתי לכם כי מספר הכדורים בכד הוא בהכרח 45 או 60?

אין בעיה: פשוט צריך לחשב את כל ההסתברויות האפשריות לכל המקרים, החל מ-0 כדורים אדומים ועד ל-90 כדורים אדומים. בסך הכל מדובר כאן ב-91 חישובים, ואז למצוא את הערך שעבורו מתקבלת ההסתברות המקסימלית. אם תעשו את החישובים תמצאו כי הערך הזה הוא 59.

אבל יש דרך יותר קלה. אפשר לכתוב את ההסתברות להוציא 175 כדורים אדומים כפונקציה של ההסתברות להוציא כדור אדום אחד מהכד בשליפה בודדת. בעזרת קצת חדו”א אפשר למצוא את הערך שיביא את ההסתברות הזו למקסימום, וזה יהיה אמדן הנראות המירבית להסתברות להוציא כדור אדום מהכד.

שיטת האמידה על ידי נראות מקסימלית היא אחת משיטות האמידה החשובות ביותר בסטטיסטיקה. זאת מכיוון שלאמדי נראות מקסימלית יש תכונות מתמטיות העושות אותם לעדיפים במספר מובנים על פני אמדים אחרים. לכן השימוש בשיטה הזו נפוץ מאוד, וכל תכנה סטטיסטית מאפשרת את החישוב שלהם עבור כמעט כל מודל סטטיסטי.


הערות
  1. זו לא הגישה האפשרית היחידה. יש עוד גישות אפשריות, וייתכן ואדון בהן בפעם אחרת []
  2. אני מדלג על החישובים כי זה לא החלק החשוב כאן. למי שמעוניין, החישובים נמצאים כאן []

יעילות טיפול חדש לאוסטאורופוזיס

נניח כי זה עתה אושר טיפול חדש לאוסטאופורוזיס. נתוני הניסויים הקליניים מראים כי 10% מהחולים שלא טופלו סבלו משבר בצוואר הירך במהלך 3 שנות מעקב, בעוד שבקבוצה דומה של חולים שטופלו בקביעות בטיפול החדש, רק 5% סבלו משבר כזה.

בכמה חולים צריך לטפל בטיפול החדש כדי למנוע שבר אחד?

מתוך 100 חולים לא מטופלים, אנחנו מצפים כי 10 חולים יסבלו משבר. אם נטפל ב-100 חולים, יהיו בממוצע רק 5 חולים שיסבלו משבר. לכן טיפול ב-100 חולים מונעים 5 שברים, ומכאן שכדי למנוע שבר אחד יש צורך לטפל ב-20 חולים.

מדד זה ידוע בשם NNT: ראשי תיבות של Number needed to Treat. ככל שערכו נמוך יותר כך הטיפול יעיל ביותר. הערך הטוב ביותר הוא 1: טיפול כזה ימנע את השבר אצל כל החולים במשך שלוש שנים.

נשווה מדד זה למדדים אחרים. נסדר את הנתונים ההיפותטיים בטבלה:

שבר
טיפול חדש כן לא סך הכל
כן 5 95 100
לא 10 90 100
סך הכל 587 20413 200

 

  • היעילות היחסית של הטיפול[1] היא 50%, מכיוון שהסיכון לשבר הופחת מ-10 מתוך 100 (10%) ל-5 מתוך 100 (50%).
  • היעילות המוחלטת של הטיפול היא 5%: זהו ההפרש בין 10% ו-5%. שימו לב כי ה-NNT שווה ל-1 חלקי היעילות המוחלטת.
  • יחס הסיכויים הוא 0.47. הערך של יחס הסיכויים נמוך מ-1 וזה מציין כי הטיפול החדש עדיף על הטיפול הישן[2]

בדוגמא זו, היעילות היחסית ויחס הסיכויים קרובים זה לזה בערכם, וזאת מכיוון שמספר הסובלים משבר בשתי הקבוצות דומה (90 מול 95), אולם כפי שכבר ראינו, לא תמיד זה המקרה.

 

רשימה זו היא הרשימה השביעית  בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

הנכם מוזמנים לקרוא:


הערות
  1. בדומה לסיכון יחסי של גורם סיכון []
  2. כאן מדברים על “יחס סיכויים” ולא על “יחס סיכונים” כדי לציין שמדובר בתוצאה חיובית. מבחינה מתמטית אין הבדל, כמובן. []

מה הסיכון באכילת בשר מעובד?


בשנת  2014, המכון הבינלאומי לחקר הסרטן   הודיע כי כל סוגי הבשר המעובד, ובכלל זה בייקון, סווגו כגורמי סרטן בדרגה 1. סיווג זה מתייחס לרמת העדויות המחקריות הקיימות המעידות על הקשר בין אכילת בשר מעובד ותחלואה בסרטן, אולם לא על רמת הסיכון. נוסף לכך נמסר כי אכילת בשר מעובד באופן קבוע מגדילה את הסיכון לחלות בסרטן המעי הגס ב-18%. אני ממליץ לכם לקרוא את דף המידע של האיגוד האמריקני לחקר הסרטן בנושא. הנתון של 18% נשמע מפחיד, לא?

כמו כן, ידוע כי בבריטניה הסיכון הכללי לחלות בסרטן המעי הגס במהלך החיים הוא בערך 6% לנשים ו-7% לגברים. המשמעות היא כי מתוך כל 100 נשים אנו מצפים כי כשש נשים יאובחנו כחולות בסרטן המעי גס בשלב כלשהו של מהלך חייהן. מתוך 100 נשים האוכלות בקביעות בשר מעובד, לאיזה מספר של אבחונים נצפה?

החשבון הוא פשוט: 18% מתוך 6 הם 1.08[1] , ולכן מתוך כל 100 נשים האוכלות בשר מעובד נצפה לבערך מקרה נוסף של סרטן המעי הגס, כלומר 7 מתוך מאה במקום 6. הסיכון המוחלט הוא בערך אחוז אחד. לא סיכון שניתן לזלזל בו, אבל הוא הרבה פחות מפחיד מ-18%.

במילים אחרות:

אם את אישה, ואוכלת כל יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 7%, לעומת סיכון של 6% לו היית נמנעת כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1%.

אם אתה גבר ואוכל מדי יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 9.4%, לעומת סיכון של 8% לו היית נמנע כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1.4%.

אל תבינו אותי לא נכון: אני לא מזלזל בסיכון המוגדל לתחלואה בסרטן המעי הגס. עליה בסיכון מ-6% ל-7% או מ-8% ל-9.4% היא משמעותית. האיגוד האמריקני לחקר הסרטן אכן ממליץ להפחית את הצריכה של בשר מעובד. עם זאת, הם לא ממליצים להפחית את צריכת הבשר באופן כללי. לא נמצא קשר בין אכילת בשר לא מעובד לבין תחלואה בסרטן, ולאכילת בשר יש גם יתרונות בריאותיים מסויימים. אבל חשוב להבין באילו תנאים העלייה הזו מתרחשת ומה סדר הגודל שלה. הנתון של 18% זורע היסטריה מיותרת, לדעתי.

ועוד הערה: יש הטוענים כי יש להפסיק כלל צריכת בשר מטעמים מוסריים. אני מכבד את כל מי שחושב כך, אבל כאן לא המקום לעריכת הדיון הזה. תגובות ברוח זו יימחקו.

בתיאבון.

 

רשימה זו היא הרשימה השישית  בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

רשימות נוספות בסידרה:


הערות
  1. החישוב הוא: 6×18/100 []

מהי טעות הדגימה האמיתית בסקרי הבחירות

בסקרי בחירות ודעת קהל נהוג לפרסם את “טעות הדגימה”, ולפעמים אפילו את “טעות הדגימה המירבית”.[1] אבל כאשר מדובר בסקרי מנדטים, הנתון הזה בעייתי.
נניח כי פורסם סקר לפיו מפלגה מסויימת מקבלת 30 מנדטים, וכי מצויין כי טעות הדגימה היא 4.5%. מה משמעות הדבר? 4.5% מ-30 הם 1.35. מה זה אומר? שמספר המנדטים יהיה בין 28.65 ל-31.35? אף אחר לא ידווח בסקר כי הוא חוזה למפלגה הזו 30.68 מנדטים. ומה המשמעות של טעות הדגימה הזו לגבי מפלגה שעל סף אחוז החסימה?

מה יכול להשתבש?

בסקרי מנדטים יש שלוש טעויות שמעניינות אותנו:
סוג הטעות הראשון מתייחס אל ההפרשים בין מספר המנדטים שמפלגה מקבלת בפועל ובין מספר המנדטים שהסקר חוזה כי יקבלו, או באופן יותר מדוייק – ההפרש המקסימלי שמתקבל. כמובן שאם נסתכל על כל ההפרשים של כל המפלגות הם יקזזו זה את זה וסכומם יהיה תמיד 0[2], הנתונים המעניינים הם הערכים המוחלטים של ההפרשים האלה. לדוגמא, אם מפלגה מסויימת מקבל בפועל 10 מנדטים, סקר אחד חוזה לה 12 מנדטים וסקר אחר חוזה לה 8 מנדטים, בשני הסקרים הטעות שווה ל-2.
מה הטעות המירבית האפשרית כאן? התשובה היא 120. ייתכן בהחלט כי על פי סקר מסויים מפלגה מסויימת תקבל 120 מנדטים אך בפועל היא לא תעבור את אחוז החסימה. הסיכוי לכך אפסי, אך עדיין גדול מאפס. זו הסיבה לכך ששמתי קודם את הביטוי “טעות הדגימה המירבית” במרכאות כפולות. אבל מייד נראה כמה מדדים מעניינים שכן יכולים לתת לנו מבט אל רמת הדיוק של הסקר.
סוג הטעות המעניין השני הוא הסיכוי שהסקר יראה כי מפלגה מסויימת עברה את אחוז החסימה למרות שלא עברה אותו בפועל. זה כמובן תלוי במרחק של המפלגה מאחוד החסימה. אחוז החסימה הוא כיום כ-134 אלף קולות. הסיכוי שהסקר יטעה ביחס למפלגה שבפועל קיבלה רק 70 אלף קולות בוודאי נמוך מהרבה מהסיכוי הדומה למפלגה שקיבלה 133 אלף קולות.
סוג הטעות המעניין השלישי הוא הסיכוי שהסקר יראה כי מפלגה מסויימת לא עברה את אחוז החסימה למרות שעברה אותו בפועל. זוהי תמונת המראה של הטעות השניה.
הכל טוב ויפה, אבל איך מחשבים את כל הדברים האלה?

איך אפשר להעריך את גדולי הטעויות?

דרך אפשרית לקבל הערכות לגדלי הטעויות האלה היא לבצע סימולציה. הרעיון מאוד פשוט והוסבר כבר בעבר. מניחים הנחה על התוצאה האמיתית הבחירות. אחר כך לוקחים מדגם ורואים מה קורה. חוזרים על כך הרבה פעמים, ולבסוף ממצעים הכל.
הסימולציה שלי מתייחסת לתוצאות ההיפותטיות הבאות לגבי הבחירות לכנסת ה-22. המספרים כמובן לא אמיתיים. הם מתבססים על תוצאות הבחירות לכנסת ה-21 בתוספת כמה שינויים שהכנסתי כדי להתאים אותם למה שאני רוצה להדגים. הנה טבלת “תוצאות האמת” שלי:

מפלגה מספר הקולות מספר המנדטים
הליכוד 1140370 36
כחול לבן 1125881 35
הרשימה המשותפת 337108 10
ש”ס 258275 8
יהדות התורה 249209 8
ימינה 283910 8
העבודה 190870 6
ישראל ביתנו 173004 5
המחנה הדמוקרטי 135529 4
עוצמה לישראל 133211 0
נועם 75223 0
כל השאר 33333 0
סך הכל 4102590 120

 

בישלתי את המספרים כך שאחוז החסימה עומד על 134417 קולות. עוצמה לישראל נמצאת קצת מתחת לאחוז החסימה, המחנה הדמוקרטי קצת מעליו. המרחק של נועם מאחוז החסימה הוא כ-59 אלף קולות, בדומה למרחק של מפלגת העבודה (54 אלף). המרחק של ישראל ביתנו מאחוז החסימה הוא כ-39 אלף קולות.
עכשיו אני יכול לקחת מדגם, של 500 איש נניח, מתוך האוכלוסייה שמונה כ-4.1 מיליון מצביעים. אני פשוט אבחר באופן מקרי 500 איש מתוכם. המדגם שלי יהיה מושלם: אין הטיה כי לכל האנשים מהאוכלוסייה יש את אותו הסיכוי להיכלל במדגם, ואף אחד לא ישקר לי כאן.

הנה מדגם לדוגמה, וחלוקת המנדטים כפי שחישבתי על פי תוצאותיו:

מפלגה מספר הקולות מספר המנדטים
הליכוד 130 34
כחול לבן 132 34
הרשימה המשותפת 37 9
ש”ס 28 7
יהדות התורה 31 8
ימינה 38 10
העבודה 32 8
ישראל ביתנו 23 6
המחנה הדמוקרטי 17 4
עוצמה לישראל 0 0
נועם 0 0
כל השאר 0 0
סך הכל 500 120

 

אנחנו יכולים לראות למשל שהסקר העניק לליכוד ולכחול לבן 34 מנדטים כל אחת, בעוד שלפי “תוצאות האמת” הן קיבלו 36 מנדטים ו-35 מנדטים בהתאמה. לכן הטעויות לגבי שתי המפלגות האלה שוות ל-1 ו-2. תוכלו לוודא כי הטעות המקסימלית שנצפתה בסקר הזה היא 2, הטעות החציונית היא 1 והטעות הממוצעת היא 0.91. הסקר הזה לא העלה את עוצמה לישראל ונועם אל מעל אחוז החסימה, ולא הוריד אף מפלגה שעברה בפועל את אחוז החסימה אל מתחת לו.
את התרגיל הזה ביצעתי 2000 פעם עבור מדגם בגודל 500, וגם עבור מדגמים בגדלי 1000, 2000, 4000, ו-8000.

תוצאות הסימולציה

תוצאות גדלי הטעות שחושבו בסימולציה מופיעות בטבלה הבאה:

גודל המדגם טעות ממוצעת טעות מקסימלית טעות חציונית
500 1.52 4.58 1.12
1000 1.13 3.82 0.80
2000 0.92 3.42 0.60
4000 0.77 3.18 0.39
8000 0.67 3.06 0.23

 

אנו רואים כי הטעות הממוצעת בסקר בגודל 500 היא כמנדט וחצי, והיא כמובן קטנה ככל שגודל המדגם עולה. הטעות החציונית בסקר כזה היא קצת יותר ממנדט, אבל הטעות המקסימלית היא יותר מ-4.5 מנדטים. זה קורה בגלל המפלגות שקרובות לאחוז החסימה. כשמפלגה שלא עוברת את אחוז החסימה בפועל אבל עוברת אותו במדגם הטעות היא 4 מנדטים, וכך גם במקרה ההפוך.
עד כמה נפוצים המקרים האלה? בדוגמא הזאת זה קורה די הרבה, מכיוון שיש בו שתי מפלגות שקרובות מאוד לאחוז החסימה:

גודל המדגם הועברו בטעות לא עברו בטעות
500 44.8 76.8
1000 44.9 56.2
2000 43.7 51.9
4000 44.5 46.9
8000 42.4 47.3

 

חוץ מהאנומליה של 76.8% למדגם בגודל 500, אנחנו רואים כי בדרך כלל הסיכויים קרובים ל-50%.
ניתן לערוך כמובן ניתוחים יותר מתוחכמים: לחשב סטיות תקן ורווחי סמך, לבדוק מה הסיכויים לטעות במעבר אחוז החסימה עבור גדלים שונים של מפלגות, ועוד. מי שמעוניין מוזמן להוריד את קוד הסימולציה שכתבתי בשפת R ולנסות לשחק עם הנתונים.

סיכום

  • בסקרי מנדטים קטנים, כאשר גודל המדגם הוא 500, ייתכנו טעויות משמעותיות בחיזוי מספר המנדטים האמיתי. הטעות הממוצעת היא כמנדט וחצי, והטעות המקסימלית עaויה להיות גבוהה באופן משמעותי.
  • עבור מפלגות המתנדנדות באיזור אחוז החסימה, גם מדגם גדול הרבה יותר אינו יכול לתת תשובה אמינה לגבי השאלה האם מפלגות אלה יעברו את אחוז החסימה.

 

ראו גם את שאר הרשימות שכתבתי בנושא הסקרים.


הערות
  1. אני שם את הביטויים האלה במרכאות מכיוון שאינם מדוייקים ואף מטעים. אתייחס לכך בפוסט נפרד בעתיד. []
  2. מדוע? []