ארכיב עבור 'מה אומרת הסטטיסטיקה'
שיטות עיקריות לניתוח לוחות שכיחות – מצגת ההרצאה
ביום חמישי האחרון, 5.1.2012, נערך יום עיון משותף שארגנו הלשכה המרכזית לסטטיסטיקה והאיגוד הישראלי לסטטיסטיקה. מסגרת זו נתתי הרצאה שסקרה שיטות עיקריות לניתוח לוחות שכיחות. בין הנושאים שנסקרו: זיהוי מבנה קשר בין משתנים על ידי שימוש ביחסי הסתברויות וניתוח שאריות, מדדי קשר, ומודלים לוג-לינאריים.למעוניינים, מצגת ההרצאה ניתנת לצפיה והורדה – לחצו על הלינק.
נשלח: 7 בינואר, 2012. נושאים: מה אומרת הסטטיסטיקה.
תגובות: אין
| טראקבק
סטטיסטיקאים בפאב
ב-20 באוקטובר צויין ברחבי העולם יום הסטטיסטיקה הבינלאומי. לציון (מאוחר) של האירוע נערך בתאריך 14.11.2011 ערב הרצאות מיוחד במסגרת "ספקנים בפאב" בתל-אביב.
ספקנים בפאב הם מפגשים (בדרך כלל חודשיים) המיועדים לכל מי שמתעניין במדע, היסטוריה, פילוסופיה ובחינה רציונלית של המציאות. בדרך כלל הם מתקיימים בפאבים או במקומות אחרים שמאפשרים אווירה חברית ובלתי פורמלית, וכוללים בדרך כלל הרצאה (או "תוכנית אומנותית" אחרת) ודיון. "ספקנים בפאב" נערך לראשונה בלונדון בשנת 1999, וכיום קיימות עשרות קבוצות ברחבי העולם. במסגרת הקהילה הספקנית בישראל קיימות ארבע קבוצות של ספקנים בפאב, בחיפה, תל-אביב, באר שבע וירושלים.
![]() |
הערב, שאורגן בשיתוף פעולה בין האיגוד הישראלי לסטטיסטיקה ובין קבוצת הספקנים הישראלית (כמה נוח שאני פעיל בשני הארגונים האלה. זה תרם מאוד לשיתוף הפעולה…) כלל חמש הרצאות קצרות (15 דקות כל אחת) שסקרו את נושא הסטטיסטיקה מכיוונים שונים. למרות מזג האויר הסוער בערב האירוע, הגיעו אליו קרוב ל-100 איש, ואולם האירועים של פאב "גורדו" בתל-אביב היה מלא מפה לפה. חלק מהנוכחים נאלצו לשבת על הרצפה מחוסר מקום. חלק מהמאחרים לאירוע פשוט לא הצליחו להכנס לאולם הצפוף.
![]() |
טל גלילי, דוקטורנט לסטטיסטיקה באוניברסיטת תל אביב, אוהב קוד פתוח ומידע חופשי, ובלוגר ב"מדריך לטרמפיסט בסטטיסטיקה", סיפר כיצד חוקרים עכברים שחוקרים את סביבתם: יום אחד עכבר קם בבוקר, מחליט שהוא סקרן, ומתחיל ללכת. לאן הוא הולך? מתי הוא חוזר? כמה הוא מטייל? האם הוא מתרגש? ולמה זה בכלל מעניין אותנו (כחוקרים) לדעת?
![]() |
הרצאתו של דובי קננגיסר, דוקטורנט למדע המדינה באוניברסיטת טורונטוו ובעל הבלוג "לא שומעים!", נשאה את הכותרת "מחשב, מחשב שעל הקיר". דובי דן בשאלה האם סקרי הבחירות מעוותים את תוצאות הבחירות או שמא אין להם שום השפעה בכלל. אפשרות נוספת שהציג היא כי בעצם סקרי הבחירות עוזרים לנו לגלות מה באמת אנחנו רוצים להצביע.
![]() |
הרצאתו של פרופ' רון קנת, נשיא האיגוד, נשאה את הכותרת המסקרנת ורבת המשמעות "42". רון הראה כיצד הוספת הקשר משנה את המשמעות של מספר כמו 42, ותוך כדי כך ערך לקהל היכרות עם כלים סטטיסטיים ומושגים כגון היסטוגרמה, תרשים פיזור, התפלגות נורמלית, הערכת יכולת תהליך, תרשים בקרה ו-InfoQ.
![]() |
עבדכם הנאמן דיבר על כדור הכסף (Moneyball), ספר וסרט המספרים את סיפורה של קבוצת הבייסבול המקצוענית דלת התקציב מאוקלנד, שהצליחה בעזרת שימוש בניתוחים סטטיסטיים להציב על המגרש קבוצה תחרותית, שהצליחה להתמודד מול קבוצות עתירות תקציב כמו הניו-יורק יאנקיז, ולהיות מועמדת רצינית לאליפות.
![]() |
אבנר שחר קשתן דיבר על שקרים יפים, וסקר אינפוגרפיקות מטעות בתקשורת. אבנר הוא, מתכנת, עיתונאי וסטודנט לתואר שני בתוכנית למדע, טכנולוגיה וחברה באוניברסיטת בר אילן. בנוסף לכךהוא כותב שני בלוגים: "אקלקטיקה אהובתי" ו-"שקרים יפים".
![]() |
מעניין לציין כי רק שלושה מבין חמשת המרצים הם סטטיסטיקאים בהכשרתם.
הערב הוכיח כי יש בקהל הרחב רצון אמיתי להכיר את עולם הסטטיסטיקה, וניתן להגיע לקהל זה אם יוצאים ממגדל השן, ומציגים את הפן היפה של הסטטיסטיקה ויישומיה.
![]() |
תודה לליאורה לוי עבור הצילומים מהערב.
נשלח: 29 בנובמבר, 2011. נושאים: האנשים שמאחורי הסטטיסטיקה, מה אומרת הסטטיסטיקה.
תגובות: 1
| טראקבק
ספקנים בפאב – ערב הרצאות מיוחד לכבוד יום הסטטיסטיקה הבינלאומי
|
"ספקנים בפאב" הם מפגשים המיועדים לכל מי שמתעניין במדע, היסטוריה, פילוסופיה ובחינה רציונלית של המציאות. המפגשים מתקיימים בפאבים או במקומות אחרים שמאפשרים אווירה חברית ובלתי פורמלית, וכוללים בדרך כלל הרצאה ודיון. "ספקנים בפאב" נערך לראשונה בלונדון בשנת 1999, וכיום קיימות עשרות קבוצות ברחבי העולם. במסגרת הקהילה הספקנית בישראל קיימות ארבע קבוצות של ספקנים בפאב, בחיפה, תל-אביב, באר שבע וירושלים. ב-20 באוקטובר צויין ברחבי העולם יום הסטטיסטיקה הבינלאומי. לציון(מאוחר) של האירוע ייערך בתאריך 14.11.2011 ערב הרצאות מיוחד במסגרת "ספקנים בפאב" בתל-אביב בשיתוף פעולה עם האיגוד הישראלי לסטטיסטיקה (ששת קוראיי יודעים בודאי על הקשרים ההדוקים שיש לי גם עם הקהילה הספקנית וגם עם איגוד הסטטיסטיקה). הערב יכלול חמש הרצאות קצרות (15 דקות כל אחת) שיסקרו את נושא הסטטיסטיקה מכיוונים שונים. האירוע יתקיים בתאריך 14.11.2011 בפאב "גורדו", בחוף גורדון בטיילת תל אביב. ההתכנסות היא בשעה 8 בערב, וההרצאות יחלו בשעה 8.30. דמי הכניסה הם 10 ש"ח, ומיועדים לכיסוי הוצאות הפקת האירוע. |
![]() |
|
|
המרצים, (באופן מפתיע, לא כולם סטטיסטיקאים) וכותרות ההרצאות הם:
אני מניח כי מי שקרא עד כאן כבר הבין שגם אני נמנה עם המרצים אשמח לראותם! |
||
נשלח: 7 בנובמבר, 2011. נושאים: האנשים שמאחורי הסטטיסטיקה, הממ... מעניין..., מה אומרת הסטטיסטיקה.
תגובות: אין
| טראקבק
איך לשקר בעזרת סטטיסטיקה – פוסט הרצאה
ראשית, ברצוני להודות לכל מי שטרח והגיע להרצאה שנתתי בחיפה בתחילת השבוע. מקווה שכולם נהנו. אני מאוד נהניתי.
ציינתי כי חלק ניכר מהדוגמאות שסקרתי בהרצאה כבר הופיעו כאן בבלוג בעבר. להלן מראי מקום לנושאים שסקרתי.
- על ספרו של דארל האף, How to lie with statistics כתבתי כאן לא מזמן.
- על ספרו של צארלס זייף, Proofiness, יש לי רשימה בתכנון. בינתיים קחו לינק לגוגל בוקס.
- והנה גם לינק לספר The numbers game, ולפודקסט More or Less שממנו צמח הספר.
- על נתונים מופרכים/מופרחים/מומצאים/בלתי ניתנים לוידוא: מירב ארלוזורוב והנתונים שהביאה על שכר המורים, והמסע שלי בחיפוש אחר הנתונים הנכונים; דיון בשאלה הרת הגורל כמה מכוניות יש לסטודנטים; אלה רק שלוש דוגמאות שהבאתי במשך שש וחצי השנים בהן אני כותב את הבלוג.
- לינק לרשימה על סקר הבחירות שחזה את נצחונו של לנדון על רוזוולט ב-1936.
- על הזינוק של מעריב בסקר TGI קראו בבלוג העולם ב-64 משבצות.
- על המנהל והפועלים, ועל שלי יחימוביץ שנפלה בפח הזה
- גם על רגרסיה לממוצע אני מקווה לכתוב יום רשימה, בינתיים תסתפקו במה שלויקיפדיה יש מה להגיד בנושא
- כתבתי רבות על גרפים גמישים: שטרסלר, משרד האוצר, הצגה בעייתית של נתוני הוצאה על בריאות בכלכליסט, ויש עוד
- את הדוגמא על השוואת תפוחים ותפוזים לקחתי מהבלוג "אקלקטיקה אהובתי" שכותב אבנר קשטן.
- על הבעייתיות באקסטרפולציה כתבתי כאשר הצגתי את שיטת הריבועים הפחותים
- דיון על עקומת לאפר – התיאוריה והמציאות
- הרשימה על מתאם וסיבתיות הייתה הרשימה הראשונה שכתבתי בנסיכת המדעים, ביוני 2004. על המתאם בין צבע המכוניות והסיכון לתאונות דרכים כתבתי לפני כשנתיים.
- הרשימה מחקר האוצר על "שכר המינימום ונזקיו" – קריאה ביקורתית היא אחת הרשימות שאני הכי גאה בהן. היא גררה שלוש רשימות המשך בהן התנהל דיון עם קוראיי בנושא.
- על מה שנראה כאפליית נשים בקבלה לאוניברסיטת ברקלי כתבתי ברשימה על האפקט הידוע בסטטיסטיקה בשם"פרדוקס סימפסון".
- פול התמנון – פלא על טבעי או קוריוז סטטיסטי? זה לא שונה ממה שקרה בלוטו הבולגרי. גם לא מפתיע.
- תאורה לא מגבירה סיכון לסרטן – קראו בבלוג של טל גלילי מדוע.
- את ההרצאה סיימתי בציטוט של פלורנס נייטינגייל – שהייתה סטטיסטיקאית דגולה.
נשלח: 27 בינואר, 2011. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 3
| טראקבק
פיס 123: תוחלת הזכיה וסיכויי הזכיה בתביעה
תקציר הפרקים הקודמים: ארגון אמון הציבור מגלה טעות בסיכויי הזכיה שפורסמו באתר מפעל הפיס. מפעל הפיס מתקן את הטעות. אחד המהמרים, שהוא גם ד"ר למתמטיקה, תובע את מפעל הפיס בסכום של 3.2 מליון שקלים + 5 מליון שקלים כפיצוי על עגמת הנפש.
ובכן, לאחר שאומתו סיכויי הזכיה במשחק פיס 123 המפורסמים כעת באתר מפעל הפיס, ניתן לגשת לחישוב תוחלת הזכיה והערכת סיכויי התביעה הייצוגית.
כאשר ידועים סיכויי הזכיה וגובה הפרסים וההפסדים, החישוב הוא פשוט: מכפילים כל זכיה/הפסד בהסתברות שלה, ומסכמים.
למשל, הסיכוי לזכות בפרס הראשון במשחק המשולב הוא 1 ל-1000, או 0.001. מי שמהמר על שקל יקבל כפרס 100 שקלים, ולכן סך הרווח שלו הוא 99 שקלים. מכפילים 99 ב-0.001 ומקבלים 0.099. כל עושים לגבי שאר הפרסים, כמפורט בטבלה, ולבסוף יש לסכם את כל המכפלות.(נתוני יחס הזכיה ומכפיל הזכיה לפרסים 1 עד 4 שבטבלה נלקחו מאתר מפעל הפיס):
| פרס | יחס זכיה | הסתברות זכיה | מכפיל פרס | רווח/הפסד | מחובר לתוחלת |
| ראשון | 1:1000 | 0.00100 | 100 | 99 | 0.0990 |
| שני | 1:241.5 | 0.00414 | 25 | 24 | 0.0994 |
| שלישי | 1:37 | 0.02703 | 5 | 4 | 0.1081 |
| רביעי | 1:4.11 | 0.24331 | 1 | 0 | 0.0000 |
| אין זכיה | 1.38 | 0.72452 | 0 | 1- | 0.7245- |
| סך הכל | 0.4180- |
השורה התחתומה אומרת כי על כל שקל הימור, מפעל הפיס מרוויח (והמהמרים מפסידים) 41.8 אגורות, ובמלים אחרות, מפעל הפיס לוקח לקופתו 41.8% מכספי ההימורים ומחלק למהמרים 58.2% מהכספים כפרסים. אל תסמכו עלי. אנא בדקו את חישוביי.
לאחר שצלחנו את החלק הטכני המשעמם הזה, הבה נעבור לניתוח סיכויי הזכיה של הד"ר למתמטיקה בתביעה הייצוגית שלו.
התובעים, כך פורסם, הציגו שתי טענות:
הטענה הראשונה היא כי מפעל הפיס הציג באתר האינטרנט שלה שסיכויי הזכיה בפרס השני הם 1:200, אולם לפי חישוביהם, הסיכוי לזכות בפרס השני הוא למעשה 1:500. את הטענה הזו אפשר לבדוק. אני חושב שכולם כבר מסכימים על כך שסיכויי הזכיה בפרס השני הם לא 1 ל-200 וגם לא 1 ל-500, אלא 1 ל-240 (בערך).
הטענה השניה היא כי לפי מפעל הפיס, תוחלת ההגרלה 123 משולב אמורה להיות בשיעור של 60.34%, כלומר 60.34% מכספי ההימור מחולקים כפרסים, אולם בפועל, כך נטען בתביעה, תוחלת ההגרלה הינה בשיעור של 58.2% בלבד (כפי שהראה החישוב שערכתי למעלה).
קודם כל, לא ברור לי איך חישוב הסתברות שגוי הוביל לחישוב תוחלת נכון. ייתכן כי חישוב ההסתברות היה נכון (בכל זאת ד"ר למתמטיקה) אולם לכתב התביעה, או להודעה לעיתונות, או לכתבה השתרבב מספר שגוי.
התובעים הנכבדים צריכים, אני מניח, להוכיח כי הפרסום השגוי נעשה בזדון ומתוך כוונה להטעות את המשקיעים המהמרים התמימים. האם יצליחו התובעים להוכיח זאת? איני יודע.
אבל הטיעון העיקרי שלי, ואני מקווה שגם של ההגנה, הוא: אז מה? ונניח שפורסם מספר שגוי, והתוחלת אכן נמוכה ממה שפורסם. האם בפועל הייתה התוחלת שונה? כללי המשחק היו נתונים, ובהנתן הכללים נקבעת התוחלת. הנזק היחיד שעלול להגרם בפועל הוא הנזק למהמר שנכנס לאתר ואמר לעצמו: "וואו, תוחלת של 60.3%! אני הולך על זה! זו לא סתם הגרלה מעפנה שנותנת רק 58.2%!". כמה מהמרים כאלה היו? על כמה כסף הם הימרו? אחרי שנדע את הנתון הזה, נוכל להעריך את הזנק שנגרם להם: 2.1% מסך הסכום שעליו הם הימרו. ההימור שלי הוא כי סך הסכום הזה הוא אפס, או כמעט אפס.
אז מה סיכויי הזכיה? לא רעים בכלל. השופטים, אנשים טובים ומקצועיים אמנם, אבל רובם לא מבין בסטטיסטיקה, פשוט כי ההכשרה שניתנת לתלמידי הפקולטה למשפטים בתחום הזה מזערית. לשקר בעזרת סטטיסטיקה אפשר גם אפשר, וייתכן מאוד שיימצא שופט שישתכנע מהטיעונים.
אני אמשיך לעקוב.
נשלח: 23 בנובמבר, 2010. נושאים: הימורים, מה אומרת הסטטיסטיקה.
תגובות: 9
| טראקבק











