הקדמה – מדגמים וטעויות
רשימה זו נכתבת שבוע לפני הבחירות לכנסת, אירוע המניב כמות גדולה למדי של סקרי דעת קהל. עם זאת, סקרי דעת קהל ומחקרים סטטיסטיים אחרים נפוצים למדי בכל ימות השנה. ברוב הסקרים המתפרסמים בעיתונות יש מידע כלשהו על “טעות הדגימה”, או “טעות הדגימה המירבית”. כך למשל, בסקר שבוצע על ידי חברת דיאלוג בפיקוח פרופסור קמיל פוקס ופורסם באתר עיתון “הארץ” נאמר כי “שיעור הטעות המקרית לכל שאלה בנפרד היא 3.9%”. בסקר אחר שנערך על ידי מכון דחף בניהולה של ד”ר מינה צמח ופורסם באתר Ynet נמסר כי “טעות הדגימה: בין 0.8 מנדטים למפלגה עם שני מנדטים לבין 3 מנדטים לערך למפלגה עם 33 מנדטים“. מכאן שעל פי סקר מכון דחף, טעות הדגימה נעה בין 9 ל-40 אחוזים. סקר דחף, אגב התבסס על מדגם של 1000 משיבים, בעוד שסקר מכון דיאלוג הסתמך על מדגם קטן יותר של 666 נבדקים.
מבולבלים? אנסה לעשות קצת סדר בדברים.
ראשית, אזכיר לכם מהו מדגם. אנו מעוניינים לדעת תכונה מסויימת של אוכלוסיה מסויימת, כמו למשל, שיעור האזרחים המתכוונים להצביע עבור מפלגה מסויימת בבחירות הקרובות. אפשר כמובן, לפנות לכל אחד מהאזרחים בעלי זכות ההצבעה ולשאול אותם, אבל זו דרך בלתי יעילה (בלשון המעטה). אפשרות אחרת היא לבחור קבוצה חלקית של האוכלוסיה, ולשאול את חברי הקבוצה הזו לגבי כוונת הצבעתם בבחירות. הקבוצה הזו נקראת “מדגם”. לאחר שיש בידינו את הנתונים מהמדגם, אנו מנסים להסיק מהפרט (קבוצת המדגם) אל הכלל (כלל האוכלוסיה). שלב זה הוא שלב ההסקה הסטטיסטית, וזו למעשה כל התורה הסטטיסטית על רגל אחת.
הבעיה במדגם היא שיכולות לקרות טעויות, ועקב כך, הנתונים שאספנו במדגם לא משקפים את התכונות האמיתיות של האוכלוסיה. כל הטעויות האלה נכללות תחת המטריה של “טעות הדגימה”. למעוניינים בהגדרה מדויקת: טעות הדגימה היא אי הדיוק באמידה של פרמטר באוכלוסיה הנגרמת עקב מדידתו בקבוצה חלקית בלבד של האוכלוסיה.
ניתן לחלק את כל הטעויות האפשריות לשני סוגים: טעויות שיטתיות וטעויות מקריות. טעות הדגימה היא סך שני סוגי הטעויות – השיטתיות והמקריות.
טעויות שיטתיות
טעויות שיטתיות הן טעויות הנובעות מתכנון וביצוע לקוי של הדגימה. הן מביאות לכך שנתוני המדגם שונים באופן אינהרנטי מנתוני האוכלוסיה, או, במלים יותר עממיות: המדגם אינו מייצג את האוכלוסיה. הנה מספר דוגמאות מפורסמות של טעויות שיטתיות בסקרי בחירות:
- בבחירות לנשיאות ארצות הברית ב-1936, חזה סקר ה-Literary Digest ניצחון למועמד הרפובליקני לנדון שהתמודד מול הנשיא המכהן רוזוולט. שאלון הסקר נשלח בדואר אל בעלי טלפונים וחברי מועדונים, כלומר תת אוכלוסיה של אנשים אמידים בזמן משבר כלכלי קשה. בעוד שהאמידים נטו לתמוך בלנדון, מעוטי היכולת, שהיו רוב גדול בקרב הבוחרים, תמכו ברוזוולט. הסקר דגם באופן שיטתי יותר תומכי לנדון מתומכי רוזוולט. בעיה נוספת בסקר זה הייתה השיעור הגבוה של נסקרים שלא השיבו לשאלון הסקר – 76%. בניסיון שהצטבר מאז התברר כי יש הבדלים משמעותיים בין המשיבים לשאלות הסוקרים ובין אלה שבוחרים לא להשתתף במדגם.
- בבחירות לנשיאות ארצות הברית ב-1948, חזו כל הסקרים ניצחון למועמד הרפובליקני דיואי שהתמודד מול הנשיא המכהן טרומן. חלק מהסקרים היו טלפוניים, בתקופה בה מכשיר הטלפון עדיין לא היה נפוץ כבימינו. בעלי מכשיר טלפון היו באופן טבעי אמידים יותר מאלה שאין ברשותם מכשיר, וגם תומכים ברפובליקנים. בסקרים אחרים, שהתבצעו על ידי מראיינים בשטח, המראיינים יכלו לבחור את הנסקרים כרצונם, ומטבע הדברים פנו לחפש אותם באזורים “נוחים” – שכונות טובות, יותר עשירים, יותר רפובליקנים. בעיה נוספת הייתה שרוב הסקרים נערכו כחודשיים לפני הבחירות עצמן, כיוון שהיה מקובל לחשוב כי רוב הבוחרים מחליטים למי יצביעו כבר בספטמבר. כך לא לקחו הסקרים בחשבון את המומנטום של טרומן בחודש האחרון לפני הבחירות.
- לעיתים הנסקרים אינם כנים בתשובותיהם.
- בשיחה עם אלכס אנסקי (( 1. מכירת הליכוד – אלכס אנסקי, עמוד 167, הוצאת זמורה ביתן מודן, 1978)) סיפר יוסי שריד על סקר בחירות שביצע “מומחה גדול מחברה בעל מוניטין בסקרי דעת קהל” עבור המערך במערכת הבחירות לכנסת השביעית ב-1969. הסקר חזה כי המערך יזכה ב-72 מנדטים. שריד הסביר את טעותו של הסוקר: “הוא לא ידע שבארץ אנשים שמצביעים בשביל האופוזיציה לא אומרים זאת בגלוי, ובמקום זאת מסמנים ‘לא יודע'”. מסיבות השמורות עימם (ואני לא שופט אותם), העדיפו תומכי האופוזיציה לא לענות בכנות לחלק משאלות הסקר.
- בבחירות 1981, חזה מדגם הטלוויזיה הישראלית ניצחון למערך בראשותו של שמעון פרס. המדגם, שנערך על ידי חנוך סמית, נערך בשיטת “סקר יציאה”: המדגם היה מדגם של קלפיות, וביציאה של כל קלפי הוצבה קלפי על ידי צוות הסקר, וכל אדם שהצביע התבקש להצביע שוב בקלפי הסקר בדיוק כפי שהצביע דקות אחדות קודם לכן בקלפי האמיתית. כאמור, על פי התוצאות מקלפיות הסקר נחזה ניצחון למערך. כשעתיים לאחר סגירת הקלפיות, כאשר התקבלו תוצאות האמת מהקלפיות שנדגמו, התגלו פערים משמעותיים בין ההצבעה האמיתית וההצבעה בקלפיות הסקר. ככל הנראה, מצביעים רבים שבחרו בליכוד, הצביעו בקלפיות הסקר עבור המערך. סמית תיקן את תחזיתו על סמך תוצאות האמת מקלפיות המדגם, שהראו כי הליכוד ניצח בבחירות, כפי שהתברר לאחר ספירת כל הקולות.
- כיום רוב מוחלט של הסקרים נערכים באופן טלפוני, כאשר הסוקרים מתקשרים לטלפון קווי ומבקשים מהעונה שמעבר לקו לענות לשאלון. בשנים האחרונות גדלה תפוצתו של הטלפון הסלולרי, וכיום יש חלק גדול באוכלוסיה שאין ברשותו טלפון נייח אלא רק טלפון סלולרי. חלק זה אינו נכלל ברוב מדגמי הסקרים, נכון לכתיבת שורות אלה. ברור לחלוטין כי יש הבדלים משמעותיים בין בעלי טלפון נייח ובין אלה המשתמשים בטלפון סלולרי בלבד. האם הבדלים אלה משתקפים גם באופן ההצבעה שלהם? איש אינו יודע, עדיין.
טעויות שיטתיות קשות ביותר לגילוי, ובדרך כלל מתגלות, אם הן מתגלות, רק לאחר מעשה. לרוע המזל, לא ניתן להתגבר עליהן באמצעות הגדלת גודל המדגם. הסקר של ה-Literary Digest מ-1936 היה סקר הבחירות הגדול ביותר שנערך אי פעם – 2.4 מליון איש השיבו לסקר, ובכל זאת הסקר כשל לחזות את המנצח בבחירות. כאשר יש טעות שיטתית, מדגם גדול יותר רק מעצים את הטעות, ואינו מכפר עליה. כמו כן, למרבה הצער, אין דרך לחשב מראש את ההשפעה הכמותית של טעות שיטתית על תוצאת המדגם.
מדגמים הסתברותיים וטעויות מקריות
כתוצאה מכישלונות סקרי הבחירות של 1948 בארה”ב, עברו בהדרגה הסוקרים להסתמך על מדגמים הסתברותיים. במדגמים כאלה, המדגם נבחר באופן מקרי מתוך האוכלוסיה, אולם הסטטיסטיקאי הסוקר יודע מה ההסתברות של כל פרט באוכלוסיה להיכלל במדגם. מדגמים הסתברותיים מאפשרים להתגבר על חלק גדול של הטעויות השיטתיות הנפוצות. בנוסף לכך, מדגם הסתברותי מאפשר לחשב את גודלה של הטעות המקרית.
מהי טעות מקרית? אם סוקר בוחר באופן מקרי 1000 איש מתוך אוכלוסיית בעלי זכות הבחירה, יש הסתברות מסויימת כי כל אותם 1000 נדגמים יהיו תומכי מפלגה קטנה בעלת כמה אלפי תומכים בלבד בכל הארץ. במקרה כזה הסוקר יחזה כי מפלגת “העתיד המופלא”, למשל, תזכה ב-120 מושבים בכנסת, בעוד שבפועל היא לא תעבור את אחוז החסימה. זה מאורע מביך, אך ההסתברות להתרחשותו של מאורע כזה קטנה ביותר. אפשר לחשב את ההסתברות, כי ההסתברות של כל אדם להיכלל בסקר ידועה. כיוון שכך, אפשר לחשב מדד סטטיסטי שיכמת את שיעורה של הטעות המקרית. כך יכול פרופסור פוקס לדווח כי שיעורה של הטעות המקרית בסקר שלו היא 3.9%. הבעיה בדיווח זה: מה משמעותו של המספר הזה? בסקר שאליו קישרתי למעלה מדווח כי מפלגות קדימה ועוצמה לישראל עוברות את אחוז החסימה וזוכות לשני מנדטים כל אחת. האם ייתכן כי אחת מהן תזכה ב-2.078 מנדטים (2 מנדטים ועוד 3.9% מ-2)? האם הכוונה היא שלפי הסקר קדימה זוכה אולי ב-2.1% מהקולות, אך יתכן שתזכה במינוס 1.8 אחוזים (2.1 פחות 3.9)?
הערכת גודל הטעות המקרית בעזרת רווח סמך
בסקר בחירות טיפוסי, נשאל כל נדגם לאיזה מפלגה הינו מתכוון להצביע בבחירות. אם ניקח את הסקר של פרופסור פוקס כדוגמא, בו השתתפו 666 איש, ייתכן כי 183 מתוכם הצהירו כי בכוונתם להצביע עבור מפלגת הליכוד ביתנו ((2. לא הצלחתי למצוא את הנתונים, ולכן אני נותן את המספר הזה כדוגמא)). אם מחלקים 183 ב-666 ומכפילים במאה מקבלים 27.5, כלומר אמדן לשיעור התומכים במפלגה זו הוא 27.5% שאמורים להעניק למפלגה 33 מושבים בכנסת (( 3. אני מתעלם מפלפולי חוק בדר עופר לצורך העניין)). כאמור, יש טעות מקרית. במדגם היו יכולים לעלות 182 תומכי הליכוד ביתנו, או 184, או 663, או כל מספר אחר בין 0 ל-666. דרך סטטיסטית מקובלת לכמת את גודל הטעות, או במלים אחרות, לציין את מידת אי הודאות של האומדן לערך האמיתי, היא לבנות עבורו רווח סמך. במלים פשוטות אך לא מדויקות, רווח סמך עבור השיעור האמיתי של תומכי הליכוד ביתנו באוכלוסיה הוא קטע המחושב מתוך תוצאות המדגם (גבול עליון וגבול תחתון) באופן שהסיכוי “לתפוס” את השיעור האמיתי בתוך הקטע הוא קבוע. נשמע מסובך, אך לסטטיסטיקאים יש כלי חזק מאוד לחישוב רווחי סמך: משפט הגבול המרכזי. אדלג על הפרטים הטכניים, ואמר רק כי רווח סמך מקורב לשיעור התומכים באוכלוסיה, ברמת סמך של 95%, הוא שיעור התומכים במדגם, פלוס מינוס אחד חלקי שורש גודל המדגם. כל זאת, כאשר מתקיימים התנאים של המשפט.
בדוגמא שלנו, שיעור התומכים בליכוד ביתנו במדגם הוא 0.275 או 27.5%. גודל המדגם הוא 666, ולכן אחד חלקי שורש 666 הוא 0.0387 או 3.9%. קמיל פוקס יודע מה הוא עושה. הדיווח בעיתון/אתר בעייתי. כאשר מדווחים כי שיעור הטעות המקרית הוא 3.9%, הכוונה היא לומר כי המרווח שבין 23.6% לבין 31.4% מכיל בתוכו “תופס” את שיעור התמיכה האמיתי בליכוד ביתנו בהסתברות של כ-95%, אם תנאי משפט הגבול המרכזי מתקיימים ((4. יש להבהיר כי כי אין פירוש הדבר כי שיעור התמיכה בליכוד ביתנו נמצא בין 23.6% לבין 31.4% בהסתברות 95%. ראו גם את תגובתו של עמית גל לרשימה זו.)).
הבעיה היא שתנאי המשפט לא תמיד מתקיימים. תנאי יסודי במשפט הוא שמדובר במדגם מספיק גדול. כמה זה “מספיק גדול”? התשובה היא: תלוי. (( 5. למעוניינים: לינק לערך ויקיפדיה על הקירוב הנורמלי להתפלגות הבינומית, שנותן תשובה מפורטת יותר וטכנית)).
אומר רק שהקירוב הנורמלי הולך ונחלש ככל שמתרחקים ממרכז ההתפלגות לקצוות. באותו סקר שפורסם באתר “הארץ” דווח גם כי מפלגת “ארץ חדשה” זוכה ב-0.7% ורחוקה מאחוז החסימה. מה זה אומר? גודל המדגם היה כזכור 666, ולכן רק 4 או 5 מהנשאלים אמרו כי יצביעו עבור ארץ חדשה. משפט הגבול המרכזי לא תקף במקרה הזה, ו-0.7 פלוס/מינוס 3.9 אינו רווח סמך לשיעור האמיתי של התומכים בארץ חדשה. שימו לב כי לו זה היה רווח הסמך, לא היה ניתן להסיק כי המפלגה אינה עוברת את אחוז החסימה ((5. כי 0.7 ועוד 3.9 שווים ל-4.8 והגבול העליון גבוה מאחוז החסימה שהוא 2%)).
דוגמא יותר קיצונית היא שיעור התמיכה במפלגות קטנות יותר. איש מבין 666 הנשאלים לא אמר כי יצביע בעד מפלגת “חיים בכבוד“. האם פירוש הדבר כי בבחירות תקבל מפלגה זו אפס קולות (פלוס/מינוס 3.9%)? אני מרשה לעצמי לא לענות לשאלה רטורית זו.
מה עושים כאשר משפט הגבול המרכזי אינו תקף? משתמשים בשיטות אחרות שאינן מסתמכות על המשפט. חישבתי את רווחי הסמך לשיעור התמיכה במפלגת “ארץ חדשה” על פי מספר שיטות שאינן מסתמכות על משפט הגבול המרכזי בהנחה ש-5 מבין 666 הנשאלים אכן אמרו כי יצביעו עבורה. בכל שיטות החישוב, הגבול העליון של רווח הסמך אינו עולה על 1.8%. הדיווח שוב נכון: על פי תוצאות הסקר, מפלגה זו אינה עוברת את אחוז החסימה. יש רק לזכור כי הנתון של “טעות דגימה בגובה 3.9%” אינו מתייחס למקרים בהם מספר התומכים בסקר קטן מדי.
אין לי קישורים, אבל אני זוכר שקראתי כמה ראיונות עם סוקרים ישראלים שאמרו שהיום הם בהחלט דוגמים גם סלולריים.
אכן, יש התקדמות בתחום, וחלק מהסקרים דוגמים גם טלפונים סלולריים.
אתה יכול להסביר איך אתה מתרגם את טעות הדגימה המובאת באחוזים למנדטים? האם כפי שכתבת עם סימן שאלה, כאשר טעות הדגימה היא 3.9 אז מוסיפים ומפחיתים 0.078 מ 2?
אשמח להבהרה בנושא
נראה לי שאת מערבבת בין הדיווחים של מינה צמח וקמיל פוקס.
מינה צמח דיווחה את טעות הדגימה שלה במנדטים, כאשר הטעות משתנה בהתאם לגודל המפלגה. אני לא יכול להסביר את הדיווח של ד”ר צמח כיוון שאני בעצמי איני מבין אותו. בכוונתי לפנות אליה בנושא, ואם אקבל תשובה, אשמח לדווח על כך.
אמנם כתבת והזהרת מראש שאינך מסביר במדוייק מהו רווח סמך, אבל לאור דברים שכתבת אחרי שהזהרת אותנו, ראוי להדגיש שהפרשנות של רווח סמך (ברמת סמך של 95%) היא *לא* שהערך האמיתי נמצא בהסתברות 0.95 בתוך המרווח שנמצא. זו פרשנות לקויה של המושג.
נקודה שעוזרת לי לפעמים להדגיש את ההבדל היא השאלה. רגע, 95% ממה?
התשובה היא 95% מהסקרים. כלומר אם היו עושים המון סקרים (על מדגמים שונים ובלתי תלויים מתוך אותה אוכלוסייה), ובכל אחד מהם מחשבים רווח סמך, אז בממוצע 95% מרווחי הסמך שחושבו היו מכילים את הערך האמיתי. מה זה אומר על רווח הסמך הספציפי שחושב בסקר ספציפי? לא הרבה.
עמית, אתה צודק בהחלט. האם עולה מדבריי משהו אחר? כי אם כן, זו בהחלט לא הייתה כוונתי. אתקן את הניסוח כדי להבהיר זאת. תודה על ההערה החשובה.
עמית, אני לא רואה הבדל גדול בין המושגים. אם בממוצע 95% מהסקרים נותנים רב”ס שמכיל את הערך האמיתי, אז א-פריורית הסיכוי שבסקר הבודד שאני עורך הסיכוי שהרב”ס המחושב יכלול את הערך האמיתי הוא 95%.
הבדל אדיר.
כדי להמחיש את ההבדל בוא נחשוב על מה אנחנו יודעים על הערך האמיתי ב5% הנותרים של המקרים.
בפרשנות הראשונה (והשגויה) של המושג, לפיה רווח הסמך נותן לנו אינפורמציה על ההסתברות למצוא את הערך של הפרמטר במקום כלשהו, ההבדל היחידי בין ה95% ל 5% הוא שגם אם אנחנו לא יודעים את הנקודה האמיתית, המודל ההסתברותי שמידע אודותיו נתן לנו (לכאורה) רווח הסמך נשאר נכון. למשל, כיוון שהתפלגות הדגימה היא נורמלית בד”כ או קרובה לה, אז ניתן לשער (תחת ההנחה שרווח הסמך נותן לנו מודל הסתברות אודות מיקומו של הפרמטר) שההסתברות למצוא את הפרמטר קרוב למרכז הרווח גבוהה יותר מההסתברות למצוא אותו בשוליו, ושאם הערך האמיתי נמצא מחוץ לרווח, עדיין סביר יותר למצוא אותו קרוב אליו מאשר רחוק ממנו.
בפרשנות האמיתית של רווח הסמך, במקרה שנפלנו על אחד מאותם 5% מהסקרים הדפוקים, מה אנחנו יודעים על הערך? כלום. נאדה. גורנישט. המשמעות היא שהסקר פשוט לא שווה כלום, המידע שאספנו בו לא נותן לנו מידע מהימן אודות מיקומו של הפרמטר. לא ב95% ולא 20% וגם לא ב0.01% וכמובן שאין לך שום דרך לדעת באיזה מן המקרים אתה.
זה מזכיר את ההבחנה שעשה פרנק נייט frank knight ב1921 בין סיכון לאי וודאות. סיכון הוא מצב בו אינך יודע מה יכול לקרות אבל אתה יכול להעריך מהן האפשרויות ואולי אפילו לקבל מה ההסתברות של כל אפשרות כזו. אי וודאות היא מצב שבו אינך לך מושג מה לעזאזל הן האפשרויות.
בהשאלה, הפרשנות השגויה אך המקובלת לצערי של רווח סמך היא שהם נותנים הערכת סיכון (במובן של פרנק נייט) אודות הערך המבוקש, ואילו המשמעות האמיתי היא שישנה אי וודאות אמיתית בנוגע לערך הזה.
הערב קיבלתי בסמס שאלות סקר בלתי חתומות: למי אצביע: ליכוד/עבודה/לבני/לפיד/מתלבט/אחר. סקר מעצבן, התשובה על חשבוני. עניתי בהתאם.
קיבלתי כמה כאלה. לא טרחתי לענות.
חבל שלא למדתי סטטיסטיקה אצלך (חבל שגם הרבה סוקרים לא). הסבר מצויין.
תודה 🙂
יוסי, סקרים זה באמת נושא כל כך אקטואלי בתקופה של טרום-בחירות. אני בטוחה שזה מעניין הרבה אנשים להבין את המינוח.
אבל הסקירה הזאת יצאה כל כך ארוכה ומלאה חישובים, שאני לא בטוחה ש”פשוטי עם” יצליחו להבין אותה. חייבת להודות שאפילו אני, עם מאסטר באפידמיולוגיה, בקושי הבנתי את ההסבר.
שלא לדבר על כך שאני בקושי זוכרת מה זה “מנדט”!
המון חישובים? טוב, מצטער, דווקא השתדלתי.
ומנדט, דרך אגב, זה לא בסטטיסטיקה 🙂
אהבתי את הפוסט, מנוסח יפה ונגיש להדיוטות.
יחד עם זאת המסקנה המתבקשת לטעמי היא שהמדגמים הללו פשוט לא רלבנטים עבור מפלגות שנמצאות בקצות הקשת מכיוון שהם אינם תקפים ובטח לא מהמנים עבור מפלגות בקצוות.
להציג מדגם עם טעות דגימה של כמעט 4% כאשר אחוז החסימה הוא 2 % זו בדיחה גרועה ותו לא.
עוד פורסם בהארץ מסמכי הסקר המלאים של קמיל פוקס
מיהמנות הסקר מפוקפקת, מהשורה הראשונה במסמכים “הסקר נערך בקרב 1,641 נשאלים. מתוכם 491 השתתפו ו-1150 סירבו להשתתף”
72% מהנשאלים סירבו להשתתף. נשאלת השאלה האם ה28% שענו הם מדגם מייצג?
http://www.haaretz.co.il/news/elections/1.1893756
הקישור למסמכים בהארץ.
תודה רבה!
תודה רבה על ההסבר המפורט. הרבה יותר ברור מהמרצה שלי. 🙂
היי יוסי,
ראשית, מאמר מצוין וכתוב ברור – תודה.
שנית, אשמח אם תוכל לענות על שאלה / שאלות בנוגע למשפט:
“[…] ברמת סמך של 95%, הוא שיעור התומכים במדגם, פלוס מינוס אחד חלקי שורש גודל המדגם”.
השאלה באופן כללי: מדוע 1 חלקי שורש המדגם?
בפרט,
א. כיצד ידועה סטיית התקן באוכלוסיה אשר יש לחלק בשורש גודל המדגם? – אם לא ידועה, מה האומדן עבורה וכיצד הוא ידוע?
ב. היכן ההכפלה ב-1.96 (לפי לוח Z)?
נ”ב
מניח שפספסתי משהו ואשמח להבין מה
לא יוסי, אבל זו ההבנה שלי ואני מקווה שאני לא מטעה.
באופן כללי, טעות הדגימה היא
0.5 ^ (p*(1-p)/n) * 1.96
אם תציב p=0.5 – הערך שממקסם את הביטוי בסוגריים – תקבל בקרוב “אחד חלקי שורש גודל המדגם”.
בפרוט:
א. תשובתו של כל בדוקאי מהווה ניסוי ברנולי עם הסתברות p. השונות של ממוצע n ניסויי ברנולי בלתי תלויים היא:
(p*(1-p)/n)
מפה מקבלים את סטיית התקן באוכלוסיה.
ב. את הביטוי לסטיית התקן כופלים ב-2 (~ 1.96), ומציבים p=0.5, לפי ההסבר למעלה. לאחר צמצום נותרים עם אחד חלקי שורש גודל המדגם.
עמית ויוסי, המסקנה אם כן – היא שאין כל ערך מעשי לסטטיסטיקה…
אם המשמעות המעשית בדוגמה היא *לא* 95% שהערך נופל ברב’ס,
אלא אין לה אפילו ערך הסתברותי (יכול להיות 1%, יכול להיות 80%) – מה המשמעות של הדגימה ? מה המשמעות של יכולת הסקה ? מה המשמעות של רב’ס ?
גם ככה “יש בעיה” בעיקרון הרב’ס (טווח ולא ערך ספציפי), הרי אם רב’ס ל50% (לדוגמה….) היה 0-100% – אין שום משמעות מעשית לא לדגימה ולא לתוצאה….
אז אם נניח שגם לרב’ס יותר מדוייק של 46-54 – אין משמעות מעשית.
מה הערך בנסיכת המדעים ?!
תשובה חלקית מחובבן לאחת משאלותיך – אומד הפרופורציה של המצביעים למפלגה באוכלוסיה הוא אומד הנראות המקסימלית (maximum likelihood). לדוגמה, אומד הפרופורציה הוא מספר מצביעי “הליכוד” חלקי מספר הנבדקים הכולל. המשמעות של האומדן הנקודתי היא שבהינתן המדגם שהתקבל ובהנחת מודל הסתברות שנשלט ע”י פרמטר(ים), פונקציית הנראות (likelihood function) מקבלת את ערכה המקסימלי כאשר הפרמטר מקבל ערך שהוא פונקציה של תשובות המצביעים. פונקציית הנראות היא צפיפות ההסתברות המשותפת לכל תשובות הנבדקים כפונקציה של פרמטר(י) המודל. כלומר, זוהי פונקציה שמתייחסת לתשובות הנבדקים שהתקבלו כקבועים, והמשתנה שלה הוא דווקא הפרמטר של המודל. המקסימיזציה עונה על השאלה איזה פרמטר של המודל (p, לדוגמה במודל ברנולי) ייתן את הערך המקסימלי לפונקציית הנראות (להסתברות המשותפת), בהינתן תשובות הנבדקים שהתקבלו.
יופי של מאמר. תודה רבה יוסי