חיפוש באתר

קישורים

עמודים

RSS סטטיסטיקה ברשת

תגים

בחירות ביוסטטיסטיקה בייסבול בנימה אישית בריאות גרפים דו"ח העוני דילמת האסירים הומור הומיאופתיה הימורים היסטוריה המשפטים הגדולים של הסטטיסטיקה הסתברות השכלה גבוהה חברה חידות חינוך חשבון יישומים כלכלה מדגם מדע מונטי הול מחקרים מירב ארלוזורוב ממוצע מצחיק משרד האוצר מתאם מתמטיקה ניהול סיכונים ניסויים קליניים סטטיסטיקה ספורט ספרים סקרים עיוות נתונים קבלת החלטות שכר שכר לימוד תאונות דרכים תורת המשחקים תקשורת p-value

ארכיב עבור דצמבר, 2008

אז במצב הנוכחי

עד כה נמנעתי מלהביע דיעה על המצב הבטחוני בדרום, בעיקר בגלל שלא גיבשתי אותה. אבל אתמול בערב נקלעתי למצב סוריאליסטי: אני יושב לי וכותב פוסט מושקע על ענייני סטטיסטיקה, כשברקע אני שומע את דיווחי החדשות הישירים על ההרוגים באשדוד ובנחל עוז. הפוסט המושקע יחכה קצת.
נשמעו הרבה דיעות לכאן ולכאן בעניין המלחמה בדרום, ואני בטוח שהקוראים נחשפו לכולן. ציטטתי פעם בבלוג זה את האימרה המיוחסת לבנג'מין פרנקלין, לפיה מעולם לא הייתה מלחמה טובה או שלום רע. אני עדיין מאמין בכך, אם כי אני מודע לכך שלפעמים הרע הוא הכרחי כדי לפתוח את הדרך לעתיד טוב יותר. לעומת זאת, אני לא מאמין בדבריו של לנין, שטען שככל שיהיה רע יותר כך יהיה אחר כך טוב יותר. אני מבין כי המלחמה הנוכחית בדרום היא רע הכרחי. אני יכול רק לקוות שהפעם נסתפק כולנו רק ברע ההכרחי להוביל אותנו למצב טוב יותר.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

תפוצת מושגי החנוכה בפרוייקט בן יהודה

הקדמה

ביום רביעי שעבר נערך מפגש של משתתפי פורום תרבות עברית בתפוז. כמקובל בפורום, נקבע למפגש נושא, המקרה זה נסים, וכל משתתף התבקש להביא חפץ או תוכן כלשהו שקשור לנס, מתוך התרבות העברית. ישבתי וחשבתי על החפץ או התוכן שאביא עימי. מאחר ובין עיסוקי (מלבד היותי חובב התרבות העברית) אני גם סטטיסטיקאי וגם נוטל חלק בפעילות של פרוייקט בן-יהודה, החלטתי “לעשות סטטיסטיקה” ולבדוק בכמה מדפי הפרוייקט מופיעה המלה “נס” והטיותיה, כגון “נסים” וכולי. מהר מאוד התברר לי שזה לא מספיק. אי אפשר לבוא למפגש הפורום ולספר כי המלה “נס” מופיע ב-X מדפי הפרוייקט ולהודיע כי בכך יצאתי ידי חובתי. הרחבתי את נושא המחקר שלי לבדוק את תפוצת מושגי החנוכה בדפי הפרוייקט, ומייד תוכלו לחזות בתוצאות. לא, הגרפים לא אפקטיביים במיוחד (סתם גרפים מאקסל), ובכל זאת אפשר ללמוד מהם משהו. הרי הפרוייקט מכיל יצירות ספרותיות שמחבריהן הלכו לעולמם לפני 70 שנה או יותר (כלומר ב-1937 לכל המאוחר), ומכך ניתן ללמוד משהו על מקומו של  חג החנוכה בתרבות העברית בתקופה שעד 1937. הנה המצגת לפניכם (אם כי הפרשנות שאספק מצומצמת, ותהיה מוגבלת להערות מתחכמות ברוח חוש ההומור הייחודי שלי).

מושג החנוכה ומושגים נלווים

ראשית, בדקתי (בעזרת מנוע החיפוש של גוגל) בכמה דפים מדפי הפרוייקט מופיעה המלה חנוכה, וכן מושגים נלווים לחנוכה, כגון אור, נס מרד וכדומה. התוצאות לפניכם (ה:

untitled1

נסים

אם מחפשים נס, מוצאים לא מעט, יותר מנס אחד גם יותר קשה למצוא, פך השמן כמעט ולא נמצא:

untitled4

נרות ואור

חיפשתי אחרי מושגים רבים הקשורים בנרות ואור, אך כולם מתגמדים בפני האור עצמו.

untitled3

מאכלים

בחיפוש אחרי מאכלים ומוצרי מזון הקשורים לחנוכה, הגעתי לתובנות הבאות: שמן יש הרבה, אך שמן זית נדיר יותר. לביבות יש, לביבה יש פחות, ולטקעס אין בכלל. סופגניות יש שתיים, סופגניה בודדת אין, מה שתומך בטענה כי סופגניה אחת פשוט לא מספיקה.

untitled5

מקומות

מכל המקומות הקשורים לחג, רק ירושלים מופיעה באופן משמעותי. מודיעין ומקומות בהם התרחשו קרבות מפורסמים זוכים לאזכורים בודדים, אם בכלל.

untitled6

קבוצות אנשים

מכבים, חשמונאים, יוונים ומתייוונים, כל קבוצות אנשים אלה קשורות לחג, אך בספרות העברית המוקדמת תפוצתם דלה:

untitled7

אישים – המכבים מול היווני

אם לא מכבים ויוונים כקבוצות, מה בנוגע לאישים עצמם? הנה שכיחות הדפים בהם מופיעים אנטיוכוס, מתתיהו והמכבים עצמם (כמון שיהודה מופיע יותר מכולם, בזכות אליעזר):

untitled8

 

חג שמח לכולם!

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

על משמעות המידע שבסקרי הבחירות

דובי קננגיסר כתב בבלוג שלו, תחת הכותרת "האם מידע הוא חסר משמעות?" הסבר מפורט על מנגנון לפיו פרסום תוצאות סקרים יכול להשפיע על המציאות (הפוליטית, ובכלל). אני מוכן להסכים עם רוב הטיעונים שלו. אני מסכים כי למידע יש משמעות. אני מסכים כי חשיפה למידע יכולה להשפיע על החלטות של אנשים, ובפרט, חשיפה למידע המתקבל מסקרי בחירות, יכולה להשפיע על החלטות של בוחרים בקשר לאופן הצבעתם בבחירות. אני מסכים לחלוטין (ותמיד טענתי זאת) עם טענתו של דובי כי יש בעיה אתית חמורה ומתמשכת בעצם הצגת המידע שבסקרים כפי שהוא מוצג בישראל, וכי שותפים לבעיה הזו גם אמצעי תקשורת וגם סוקרים. הכל נכון.

אבל יש שתי שאלות גדולות שדובי לא עונה עליהן.

באופן פילוסופי אפשר לטעון שכל דבר משפיע על המציאות, וזה בסך הכל נכון (במובן מסויים). נו, אז מה? אז גם סקרים משפיעים על המציאות (דרך המנגנון שדובי תיאר, ו/או דרך כל מנגנון אחר). אין מחלקות. השאלה החשובה באמת שצריך לשאול היא מה מידת ההשפעה שיש לסקרים על המציאות.

לומר שהסקרים מייצרים מציאות, זה לומר שמידת ההשפעה שלהם היא גבוהה ביותר. על סמך מה אפשר לומר את זה? האם ניתן להעריך מהי מידת ההשפעה של הסקרים על המציאות הפוליטית ביחס למידת ההשפעה שיש להחלטה על פעולה צבאית שראש הממשלה מקבל כמה שבועות לפני הבחירות? ביחס להודעה לעיתונות, יומיים לפני הבחירות, על המצאה גאונית שתשנה את העולם? ביחס לפיגוע שמתרחש יום וחצי לפני מועד הבחירות? אני משוכנע שתסכימו איתי כי כל אחד מהאירועים האלה השפיעו על תוצאות הבחירות שהתרחשו זמן קצר לאחר מכן, יותר מכל סקר, ויותר מכל הסקרים ביחד. ובוא לא נשכח כי הגורם העיקרי המשפיע על המציאות הפוליטית ותוצאות הבחירות הוא התפקוד של הממשלה היוצאת.

לאחר שנצליח לכמת (או לפחות להעריך) את מידת ההשפעה שיש לסקרי הבחירות (ולסקרים בכלל) על המציאות, נוכל לענות של השאלה השניה: כיצד לאזן בין הנזק שהסקרים גורמים ובין התועלת שהם מביאים, אם בכלל יש צורך לעשות זאת.

אם נחליט שיש צורך לעשות משהו בעניין, כבר הצבעתי על הפתרון בעבר, ואצביע עליו שוב.

בטווח הקצר יש לדרוש מעורכי הסקים וממי שמפרסם את תוצאותיהם להקפיד לשמור על אתיקה מקצועית. בנוסף, אפשר וצריך לדרוש מכלי התקשורת לקיים את הוראות תיקון מספר 22 לחוק הבחירות (דרכי תעמולה) הקובע כללים ברורים לאופן פרסום תוצאות סקרי בחירות, ולמידע שעל הסוקר למסור יחד עם תוצאות הסקר. אפשר גם לאכוף את החוק (לתשומת לבו של  הקורא אליעזר ריבלין).

בטווח הארוך, הפתרון הראוי טמון בחינוך. יש ללמד את עקרונות הסטטיסטיקה וקבלת ההחלטות בבתי הספר ובאוניברסיטאות באופן מקיף ויסודי. זה לא פתרון קל, ותוצאותיו יורגשו רק בעוד מספר לא מועט של שנים, אבל זהו הפתרון הרציונלי היחיד

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

הסקרים והמפלגות הערביות (אופס, המפלגות האחרות)

אחד הבלוגים שאהבתי לקרוא הוא "משמר הכנסת" (שנמצא כעת בפסק זמן ארוך) שערך דובי קננגיסר. דובי סקר בו בצורה ביקורתית הצעות חוק שהציעו נבחרינו, השיעור העיקרי שלמדתי מבלוג זה הוא שהדבר הראשון שיש לשאול כשבוחנים הצעת חוק הוא האם באמת צריך את החוק הזה, ומייד לאחר מכן יש לשאול האם החוק אכן ישיג את מטרתו.

הסיבה שאני טורח להעלות באוב את "משמר הכנסת" (חוץ מהתקווה שהבלוג יחדש את פעילותו) היא ההנחיה שפרסם אתמול יו"ר ועדת הבחירות, השופט אליעזר ריבלין. אמנם זה לא חוק, אבל החלטה של שופט עליון כמוה כחוק. כבוד השופט ריבלין הורה כי על כלי התקשורת לפרט בסקרי הבחירות גם את שמות המפלגות הערביות, בניגוד למה שנהוג עד כה בכלי התקשורת בעברית המפרסמים את התוצאות של שלוש המפלגות הערביות יחד תחת הסיווג: "מפלגות ערביות". ההנחיה באה בעקבות פנייתו של ח"כ דב חנין מחד"ש, בחור טוב בדרך כלל, אף שאיני מסכים עם כל דעותיו.

בידיעה שפרסם שחר אילן אתמול ב"הארץ", הובא הסברו של חנין כי צירוף שלוש המפלגות לסיווג אחד "מונע מהציבור להבחין ביחסי הכוחות בין הרשימות, ובסיכוייה של כל רשימה לצבור קולות בבחירות, וזאת למרות שקיימת שונות מהותית בין הרשימות".

בואו ננתח את דבריו של חנין. יש שם שלוש טענות. עם הטענה שקיימת שונות מהותית בין הרשימות הנכללות בחבילה של "המפלגות הערביות" אני מסכים לחלוטין. אם לא הייתה שונות כזו, הן היו מתאחדות לרשימה אחת. עם הטענה שהצירוף "מונע מהציבור להבחין ביחסי הכוחות בין הרשימות" אני מסכים באופן חלקי. זה נכון. אם שלוש המפלגות יצברו יחד 10 מנדטים, נניח, על פי סקר כלשהו, לא ניתן לדעת מהתוצאה איך יתחלקו עשרת המנדטים בין שלוש הרשימות. אבל האם חוסר ההבחנה נובע מעצם הצירוף בלבד? שחר אילן מסביר בהמשך שלא כך הדבר: " הסיבה העיקרית לכך שהתקשורת אינה מפרסמת פירוט של המפלגות הערביות, היא הקושי לסקור ציבור זה באמצעות מדגם קטן, והעובדה שכל המפלגות הערביות נמצאות בתחום הטעות הסטטיסטית, לכן כל פרסום של הנתונים אלה יהיה בהכרח בלתי מדוייק". לא יכולתי לכתוב זאת טוב יותר.

על הטענה השלישית, לפיה הצירוף פוגע בסיכוייה של כל רשימה לצבור קולות בבחירות, אני חולק מכל וכל. הסקרים משקפים את המציאות, לא מייצרים אותה. אני לא מעוניין לפתוח מחדש את הויכוח שהתחולל בעקבות דברי תמר הרמן (עם המשך הדיון כאן, ואחר כך כאן, וסיכומו נמצא כאן), אבל אין לי ברירה. מי שרוצה לחשוב שהסקרים משנים את המציאות, בבקשה. מי שרוצה לשכנע אותי, שיביא נתונים. In God we trust. All other, bring data.

לאחר שדנו בטיעוניו של חנין, נעבור לפתרון המוצע. האם באמת הפתרון הוא בהוראה/מעין חקיקה לסוקרים ולכלי התקשורת לשנות את פרקטיקות העבודה שלהם? אם הנזק שבצירוף שלוש המפלגות לקטגוריה אחת עולה בצורה משמעותית על הנזק שגורמת ההוראה (למשל, פגיעה בחופש העיסוק, חופש העיתונות, והתערבות בשיקולים מקצועיים), אז התשובה היא חד משמעית כן. אבל חנין לא הראה כי אכן נגרם נזק כלשהו, הוא רק טען שנגרם נזק. והוא בחר בפתרון הקל – לשכנע שופט לתת הוראה, במעמד צד אחד, מבלי שהוצגו לפניו (ככל הנראה) כל הנימוקים בעד ונגד ופתרון המוצע. אני לא מאשים כאן את חנין, הוא בחר בדרך לגיטימית כדי להשיג את מטרתו. אני סבור שהשופט הנכבד טעה במקרה הזה.

אף אם עברנו את שתי המשוכות הראשונות, כלומר השתכנענו שטענותיו של חנין נכונות כולן (ולדעתי הן לא), ואנחנו סבורים כי החלטת השופט הנכבד נכונה (ולדעתי היא לא), יש שאלה נוספת שעלינו לשאול: האם הנחיית השופט תשיג את מטרתה? גם כאן, התשובה היא ככל הנראה שלילית.

בפני הסוקרים והתקשורת עומדות כרגע שתי אפשרויות. אחת, שהיא לדעתי הפתרון הקל והראוי במקרה זה, היא לשנות את הסיווג "מפלגות ערביות" ל-"מפלגות אחרות". חנין, יהודי במפלגה דו-לאומית לא ייעלב, ובא שלום על ישראל.

אפשרות אחרת היא לפלח את הסיווג של המפלגות "האחרות" למרכיביו, כלומר לפרסם כמה מנדטים צפויים לחד"ש כמה לבל"ד וכמה לרע"מ-תע"ל. יש כמה דרכים לעשות את זה. אפשר לעשות זאת בצורה שרירותית (לחלק איכשהו את ה-10 ל-3-3-4). אפשרות אחרת היא לעשות זאת על פי התוצאות בפועל מהמדגם, וזו אפשרות בעייתית, כיוון שגדלי המדגמים קטנים בדרך כלל, וגודלה של מפלגה בת 3 מנדטים (2.5% מהמושבים בכנסת) קטן מגודל הטעות הסטטיסטית במדגם של 1200 נסקרים (2.8%), ורוב הסקרים מסתפקים בגודל מדגם קטן יותר במחיר של טעות סטטיסטית גדולה יותר (זה נכון, דרך אגב, לכל המפלגות הקטנות). אני מקווה שדרכים אלה לא יינקטו, כיוון שהן יוצרות בעיות אתיות חמורות גם מבחינה עיתונאית וגם מבחינה סטטיסטית.

אפשרות נוספת, היא לערוך מדגם נפרד באוכלוסיה הערבית, או לדאוג שתת-המדגם בשכבה של האוכלוסיה הערבית (משם באים רוב מצביעי שלוש המפלגות הנדונות, ותבניות ההצבעה בקבוצת אוכלוסייה זו שונות מהותית מתבניות ההצבעה באוכלוסיה הלא-ערבית) יהיה מספיק גדול כדי להקטין את הטעות הסטטיסטית לגודל סביר. זה לא יקרה, כי זה יעלה יותר כסף, וכמות האינפורמציה שתתקבל לא מצדיקה את ההשקעה, בניגוד למה שדב חנין חושב.

לסיכום: ח"כ דב חנין העלה טיעונים שנויים במחלוקת בפני שופט מכובד. לאחר השופט האזין לטיעונים אלה (ולא ברור אם הובאו בפניו טיעוני נגד) הוא נתן הוראה בעייתית שפוגעת בזכויות יסוד ובשיקולים מקצועיים באופן שלא ברור האם הוא מידתי, והתוצאה תהיה במקרה הטוב מכבסת מלים, ובמקרה הרע הסתבכות אתית של אנשי המקצוע. היה שווה?

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

תמונה אחת שווה אלף מלים

כותרת משנה: על מה הם חשבו?

על מה הם חשבו?

למי שלא מספיקה התמונה, הנה כמה מלים: לפני כשבוע הייתי בכנס השנתי לסטטיסטיקה יישומית על שם וו. אדוורדס דמינג, שנערך, כמו כל שנה, באטלנטיק סיטי, ניו ג'רזי. אחת ההרצאות המעניינות ששמעתי ניתנה על ידי ד"ר תומאס א בראדסטריט ממעבדות המחקר של Merck. הרצאה זו נשאה את הכותרת "Effective Communication Through Graphics". הגרף שמופיע למעלה, פורסם דווקא בעיתון מכובד (The New England Journal of Medicine). למרות זאת, אתם יכולים לנחש שהוא לא הובא בהרצאה כדוגמא לתקשורת אפקטיבית באמצעות גרפים.

למי שמעוניין לעקוב אחרי דוגמאות נוספות מהזאנר, אני ממליץ לעקוב אחרי הבלוג Junk Charts, למרות שגם עלעול יומי במדורי החדשות והכלכלה על העיתונים המקומיים יספיק בהחלט. מי שנתקל בפריט מעניין במיוחד, מוזמן לשלוח אותו אלי.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו