• חיפוש באתר

    קישורים

    עמודים

    RSS סטטיסטיקה ברשת

    תגים

    ארכיב עבור 'מה אומרת הסטטיסטיקה'

    שיטות עיקריות לניתוח לוחות שכיחות – מצגת ההרצאה

    ביום חמישי האחרון, 5.1.2012, נערך יום עיון משותף שארגנו הלשכה המרכזית לסטטיסטיקה והאיגוד הישראלי לסטטיסטיקה. מסגרת זו נתתי הרצאה שסקרה שיטות עיקריות לניתוח לוחות שכיחות. בין הנושאים שנסקרו: זיהוי מבנה קשר בין משתנים על ידי שימוש ביחסי הסתברויות וניתוח שאריות, מדדי קשר, ומודלים לוג-לינאריים.למעוניינים, מצגת ההרצאה ניתנת לצפיה והורדה – לחצו על הלינק.

    סטטיסטיקאים בפאב

    ב-20 באוקטובר צויין ברחבי העולם יום הסטטיסטיקה הבינלאומי. לציון (מאוחר) של האירוע נערך בתאריך 14.11.2011 ערב הרצאות מיוחד במסגרת "ספקנים בפאב" בתל-אביב.

    ספקנים בפאב הם מפגשים (בדרך כלל חודשיים) המיועדים לכל מי שמתעניין במדע, היסטוריה, פילוסופיה ובחינה רציונלית של המציאות. בדרך כלל הם מתקיימים בפאבים או במקומות אחרים שמאפשרים אווירה חברית ובלתי פורמלית, וכוללים בדרך כלל הרצאה (או "תוכנית אומנותית" אחרת) ודיון. "ספקנים בפאב" נערך לראשונה בלונדון בשנת 1999, וכיום קיימות עשרות קבוצות ברחבי העולם. במסגרת הקהילה הספקנית בישראל קיימות ארבע קבוצות של ספקנים בפאב, בחיפה, תל-אביב, באר שבע וירושלים.

    הערב, שאורגן בשיתוף פעולה בין האיגוד הישראלי לסטטיסטיקה ובין קבוצת הספקנים הישראלית (כמה נוח שאני פעיל בשני הארגונים האלה. זה תרם מאוד לשיתוף הפעולה…) כלל חמש הרצאות קצרות (15 דקות כל אחת) שסקרו את נושא הסטטיסטיקה מכיוונים שונים. למרות מזג האויר הסוער בערב האירוע, הגיעו אליו קרוב ל-100 איש, ואולם האירועים של פאב "גורדו" בתל-אביב היה מלא מפה לפה. חלק מהנוכחים נאלצו לשבת על הרצפה מחוסר מקום. חלק מהמאחרים לאירוע פשוט לא הצליחו להכנס לאולם הצפוף.

    טל גלילי, דוקטורנט לסטטיסטיקה באוניברסיטת תל אביב, אוהב קוד פתוח ומידע חופשי, ובלוגר ב"מדריך לטרמפיסט בסטטיסטיקה", סיפר כיצד חוקרים עכברים שחוקרים את סביבתם: יום אחד עכבר קם בבוקר, מחליט שהוא סקרן, ומתחיל ללכת. לאן הוא הולך? מתי הוא חוזר? כמה הוא מטייל? האם הוא מתרגש? ולמה זה בכלל מעניין אותנו (כחוקרים) לדעת?

    הרצאתו של דובי קננגיסר, דוקטורנט למדע המדינה באוניברסיטת טורונטוו ובעל הבלוג "לא שומעים!", נשאה את הכותרת "מחשב, מחשב שעל הקיר". דובי דן בשאלה האם סקרי הבחירות מעוותים את תוצאות הבחירות או שמא אין להם שום השפעה בכלל. אפשרות נוספת שהציג היא כי בעצם סקרי הבחירות עוזרים לנו לגלות מה באמת אנחנו רוצים להצביע.

    דובי קננגיסר

    הרצאתו של פרופ' רון קנת, נשיא האיגוד, נשאה את הכותרת המסקרנת ורבת המשמעות "42". רון הראה כיצד הוספת הקשר משנה את המשמעות של מספר כמו 42, ותוך כדי כך ערך לקהל היכרות עם כלים סטטיסטיים ומושגים כגון היסטוגרמה, תרשים פיזור, התפלגות נורמלית, הערכת יכולת תהליך, תרשים בקרה ו-InfoQ.

    רון קנת

    עבדכם הנאמן דיבר על כדור הכסף (Moneyball), ספר וסרט המספרים את סיפורה של קבוצת הבייסבול המקצוענית דלת התקציב מאוקלנד, שהצליחה בעזרת שימוש בניתוחים סטטיסטיים להציב על המגרש קבוצה תחרותית, שהצליחה להתמודד מול קבוצות עתירות תקציב כמו הניו-יורק יאנקיז, ולהיות מועמדת רצינית לאליפות.

    יוסי לוי

    אבנר שחר קשתן דיבר על שקרים יפים, וסקר אינפוגרפיקות מטעות בתקשורת. אבנר הוא, מתכנת, עיתונאי וסטודנט לתואר שני בתוכנית למדע, טכנולוגיה וחברה באוניברסיטת בר אילן. בנוסף לכךהוא כותב שני בלוגים: "אקלקטיקה אהובתי" ו-"שקרים יפים".

    אבנר שחר קשתן

    מעניין לציין כי רק שלושה מבין חמשת המרצים הם סטטיסטיקאים בהכשרתם.

    הערב הוכיח כי יש בקהל הרחב רצון אמיתי להכיר את עולם הסטטיסטיקה, וניתן להגיע לקהל זה אם יוצאים ממגדל השן, ומציגים את הפן היפה של הסטטיסטיקה ויישומיה.

    תודה לליאורה לוי עבור הצילומים מהערב.

    ספקנים בפאב – ערב הרצאות מיוחד לכבוד יום הסטטיסטיקה הבינלאומי

    "ספקנים בפאב" הם מפגשים המיועדים לכל מי שמתעניין במדע, היסטוריה, פילוסופיה ובחינה רציונלית של המציאות. המפגשים מתקיימים בפאבים או במקומות אחרים שמאפשרים אווירה חברית ובלתי פורמלית, וכוללים בדרך כלל הרצאה  ודיון. "ספקנים בפאב" נערך לראשונה בלונדון בשנת 1999, וכיום קיימות עשרות קבוצות ברחבי העולם. במסגרת הקהילה הספקנית בישראל קיימות ארבע קבוצות של ספקנים בפאב, בחיפה, תל-אביב, באר שבע וירושלים.

    ב-20 באוקטובר צויין ברחבי העולם יום הסטטיסטיקה הבינלאומי. לציון(מאוחר) של האירוע ייערך בתאריך 14.11.2011 ערב הרצאות מיוחד במסגרת "ספקנים בפאב" בתל-אביב בשיתוף פעולה עם האיגוד הישראלי לסטטיסטיקה (ששת קוראיי יודעים בודאי על הקשרים ההדוקים שיש לי גם עם הקהילה הספקנית וגם עם איגוד הסטטיסטיקה).

    הערב יכלול חמש הרצאות קצרות (15 דקות כל אחת) שיסקרו את נושא הסטטיסטיקה מכיוונים שונים.

    האירוע יתקיים בתאריך 14.11.2011 בפאב "גורדו", בחוף גורדון בטיילת תל אביב. ההתכנסות היא בשעה 8 בערב, וההרצאות יחלו בשעה 8.30. דמי הכניסה הם 10 ש"ח, ומיועדים לכיסוי הוצאות הפקת האירוע.

     

    המרצים, (באופן מפתיע, לא כולם סטטיסטיקאים) וכותרות ההרצאות הם:

    • טל גלילי – כיצד חוקרים עכברים שחוקרים את סביבתם
    • יוסי לוי – כדור הכסף
    • דובי קננגיסר – מחשב, מחשב שעל הקיר
    • רון קנת – 42
    • אבנר שחר קשתן - שקרים יפים

    אני מניח כי מי שקרא עד כאן כבר הבין שגם אני נמנה עם המרצים :-)

    אשמח לראותם!

    איך לשקר בעזרת סטטיסטיקה – פוסט הרצאה

    ראשית, ברצוני להודות לכל מי שטרח והגיע להרצאה שנתתי בחיפה בתחילת השבוע. מקווה שכולם נהנו. אני מאוד נהניתי.

    ציינתי כי חלק ניכר מהדוגמאות שסקרתי בהרצאה כבר הופיעו כאן בבלוג בעבר. להלן מראי מקום לנושאים שסקרתי.

    פיס 123: תוחלת הזכיה וסיכויי הזכיה בתביעה

    תקציר הפרקים הקודמים: ארגון אמון הציבור מגלה טעות בסיכויי הזכיה שפורסמו באתר מפעל הפיס. מפעל הפיס מתקן את הטעות. אחד המהמרים, שהוא גם ד"ר למתמטיקה, תובע את מפעל הפיס בסכום של 3.2 מליון שקלים + 5 מליון שקלים כפיצוי על עגמת הנפש.

    ובכן, לאחר שאומתו סיכויי הזכיה במשחק פיס 123 המפורסמים כעת באתר מפעל הפיס, ניתן לגשת לחישוב תוחלת הזכיה והערכת סיכויי התביעה הייצוגית.

    כאשר ידועים סיכויי הזכיה וגובה הפרסים וההפסדים, החישוב הוא פשוט: מכפילים כל זכיה/הפסד בהסתברות שלה, ומסכמים.

    למשל, הסיכוי לזכות בפרס הראשון במשחק המשולב הוא 1 ל-1000, או 0.001. מי שמהמר על שקל יקבל כפרס 100 שקלים, ולכן סך הרווח שלו הוא 99 שקלים. מכפילים 99 ב-0.001 ומקבלים 0.099. כל עושים לגבי שאר הפרסים, כמפורט בטבלה, ולבסוף יש לסכם את כל המכפלות.(נתוני יחס הזכיה ומכפיל הזכיה לפרסים 1 עד 4 שבטבלה נלקחו מאתר מפעל הפיס):

    פרס יחס זכיה הסתברות זכיה מכפיל פרס רווח/הפסד מחובר לתוחלת
    ראשון 1:1000 0.00100 100 99 0.0990
    שני 1:241.5 0.00414 25 24 0.0994
    שלישי 1:37 0.02703 5 4 0.1081
    רביעי 1:4.11 0.24331 1 0 0.0000
    אין זכיה 1.38 0.72452 0 1- 0.7245-
    סך הכל 0.4180-

    השורה התחתומה אומרת כי על כל שקל הימור, מפעל הפיס מרוויח (והמהמרים מפסידים) 41.8 אגורות, ובמלים אחרות, מפעל הפיס לוקח לקופתו 41.8% מכספי ההימורים ומחלק למהמרים 58.2% מהכספים כפרסים. אל תסמכו עלי. אנא בדקו את חישוביי.

    לאחר שצלחנו את החלק הטכני המשעמם הזה, הבה נעבור לניתוח סיכויי הזכיה של הד"ר למתמטיקה בתביעה הייצוגית שלו.

    התובעים, כך פורסם, הציגו שתי טענות:

    הטענה הראשונה היא כי מפעל הפיס הציג באתר האינטרנט שלה שסיכויי הזכיה בפרס השני הם 1:200, אולם לפי חישוביהם, הסיכוי לזכות בפרס השני הוא למעשה 1:500. את הטענה הזו אפשר לבדוק. אני חושב שכולם כבר מסכימים על כך שסיכויי הזכיה בפרס השני הם לא 1 ל-200 וגם לא 1 ל-500, אלא 1 ל-240 (בערך).

    הטענה השניה היא כי לפי מפעל הפיס, תוחלת ההגרלה 123 משולב אמורה להיות בשיעור של 60.34%, כלומר 60.34% מכספי ההימור מחולקים כפרסים, אולם בפועל, כך נטען בתביעה, תוחלת ההגרלה הינה בשיעור של 58.2% בלבד (כפי שהראה החישוב שערכתי למעלה).

    קודם כל, לא ברור לי איך חישוב הסתברות שגוי הוביל לחישוב תוחלת נכון. ייתכן כי חישוב ההסתברות היה נכון (בכל זאת ד"ר למתמטיקה) אולם לכתב התביעה, או להודעה לעיתונות, או לכתבה השתרבב מספר שגוי.

    התובעים הנכבדים צריכים, אני מניח, להוכיח כי הפרסום השגוי נעשה בזדון ומתוך כוונה להטעות את המשקיעים המהמרים התמימים. האם יצליחו התובעים להוכיח זאת? איני יודע.

    אבל הטיעון העיקרי שלי, ואני מקווה שגם של ההגנה, הוא: אז מה? ונניח שפורסם מספר שגוי, והתוחלת אכן נמוכה ממה שפורסם. האם בפועל הייתה התוחלת שונה? כללי המשחק היו נתונים, ובהנתן הכללים נקבעת התוחלת. הנזק היחיד שעלול להגרם בפועל הוא הנזק למהמר שנכנס לאתר ואמר לעצמו: "וואו, תוחלת של 60.3%! אני הולך על זה! זו לא סתם הגרלה מעפנה שנותנת רק 58.2%!". כמה מהמרים כאלה היו? על כמה כסף הם הימרו? אחרי שנדע את הנתון הזה, נוכל להעריך את הזנק שנגרם להם: 2.1% מסך הסכום שעליו הם הימרו. ההימור שלי הוא כי סך הסכום הזה הוא אפס, או כמעט אפס.

    אז מה סיכויי הזכיה? לא רעים בכלל. השופטים, אנשים טובים ומקצועיים אמנם, אבל רובם לא מבין בסטטיסטיקה, פשוט כי ההכשרה שניתנת לתלמידי הפקולטה למשפטים בתחום הזה מזערית. לשקר בעזרת סטטיסטיקה אפשר גם אפשר, וייתכן מאוד שיימצא שופט שישתכנע מהטיעונים.

    אני אמשיך לעקוב.