• חיפוש באתר

    קישורים

    עמודים

    RSS סטטיסטיקה ברשת

    תגים

    ארכיב עבור 'כללי'

    כדור הכסף – הטריילר

    זוכרים שביום שני הקרוב אני מרצה על כדור הכסף במסגרת ערב הרצאות מיוחד של "ספקנים בפאב"? אז הנה הטריילר:

    הודעה על ההרצאה: איך לשקר בעזרת סטטיסטיקה

    במסגרת פסטיבל אייקון הקרוב אתן הרצאה של כשעה בנושא "איך לשקר בעזרת סטטיסטיקה". זו תהיה גירסה מקוצרת של ההרצאה שנתתי במסגרת "ספקנים בפאב" בחיפה בתחילת השנה, ומאחר ומדובר בפסטיבל מדע בדיוני אדבר גם על הקשר בין נושא הפסטיבל ונושא ההרצאה. ההרצאה תהיה ב-18.10.2011 בשעה 8 בערב.

    מקום ההרצאה הוא באולם 3 במתחם אשכול פיס ברחוב שפרינצק 4 בתל אביב. הכניסה למתחם היא מרחוב הארבעה.

    ההרצאה בתשלום (למרות שאני מרצה בהתנדבות. הההכנסות ילכו לקופת האגודה הישראלית למדע בדיוני ופנטזיה המארגנת את הארוע) . לפרטים על רכישת כרטיסים לחצו כאן.

    אשמח לראותכם. כרגיל, לאחר ההרצאה אחלק אוטוגרפים ואצטלם עם מעריצותיי.

    הודעות – הרצאות ותחרות

    הנה כמה הודעות שאולי ישמחו את ששת קוראיי

    • במסגרת פסטיבל אייקון הקרוב אתן הרצאה של כשעה בנושא "איך לשקר בעזרת סטטיסטיקה". זו תהיה גירסה מקוצרת של ההרצאה שנתתי במסגרת "ספקנים בפאב" בחיפה בתחילת השנה, ומאחר ומדובר בפסטיבל מדע בדיוני אדבר גם על הקשר בין נושא הפסטיבל ונושא ההרצאה. ההרצאה תהיה ב-18.10.2011 בערב. פרטים מדוייקים יפורסמו בהמשך.
    • ב-20.10.2011 יצויין ברחבי העולם (חוץ מאשר בישראל) יום הסטטיסטיקה הבינלאומי. בישראל יצויין בתאריך זה חג שמחת תורה. עם זאת, אני מארגן, שוב במסגרת "ספקנים בפאב" ערב הרצאות קצרות שיסקרו את הנושא שכה קרוב לליבי מכיוונים שונים. בין המרצים יהיו טל גלילי, אבנר קשטן, רון קנת ועבדכם הנאמן. הערב יתקיים בחודש נובמבר. שוב, פרטים מדוייקים יפורסמו בהמשך.
    • ולקראת ראש השנה תעלה לכאן "תחרות היובל" – תחרות נושאת פרסים (טוב, פרס, עקב חוסר רצון לפרוץ את מסגרת התקציב של בעל הבלוג). מה פשר התחרות ולמה "תחרות היובל"? לא תופתעו אם אומר לכם שפרטים יפורסמו בהמשך.

    עוגה? לא, תודה.

    שלא תבינו אותי לא נכון. אני אוהב עוגות, מאוד. עוגות של שוקולד, גבינה, פירות, אבל לא עוגות של נתונים.
    הבעיה היא שדיאגרמות עוגה (pie charts) מאוד פופולריות. לעיתים נדמה כי מצגת או דו"ח ללא דיאגרמת עוגה אחת לפחות הינם פגומים. נדמה כי כל טיעוני הנגד אינם תקפים כאשר מוצגת דיאגרמת עוגה.

    ובכל זאת, אני טוען כי דיאגרמת עוגה, למרות ההיסטוריה הארוכה והמכובדת שלה, אינה דרך טובה להציג נתונים.
    הרעיון מאחורי דיאגרמת עוגה הוא להראות כיצד אוכלוסיה מסויימת מתפלגת למרכיביה. נניח כי אנו מתעניינים באהדת האוכלוסיה לקבוצות כדורגל, ומתברר כי במדגם של 90 איש 40 אוהדים את קבוצת הפועל תל-אביב, 30 אוהדים את מכבי חיפה, והשאר (20) אוהדים את מכבי תל-אביב. ניתן להציג מידע זה כעוגה, שמחולקת לשלוש פרוסות/גזרות, כשגודלה היחסי של כל פרוסה שווה לשכיחות היחסית המתאימה. אוהדי הפועל יקבלו פרוסה בגודל ארבע תשיעיות העוגה, אוהדי מכבי חיפה יקבלו שליש, ואוהדי מכבי תל-אביב יקבלו את מה שנשאר – שתי תשיעיות.
    התוצאה תיראה כך:

    יפה, נכון?
    שימו לב כי השכיחות היחסית מבוטאת בדיאגרמה על ידי שלושה מאפיינים גאומטריים: שטח הפרוסה, שהוא המאפיין העיקרי הנתפס על ידי העין, אורך הקשת של הפרוסה, וגודל הזוית של הגיזרה.
    וכאן הבעיה הגדולה של דיאגרמות העוגה. העין האנושית, או יותר נכון, המוח האנושי, אינם תופסים כראוי גדלים כאלה. התבוננו בחלק הירוק והחלק האדום. זוית הגזרה האדומה היא 160 מעלות וזוית הגזרה הצהובה הירוקה היא 120 מעלות. האם אתם רואים הבדל בין שתי הזוויות? המצב נעשה מסובך יותר אם יש יותר משלושה ערכים. הנה למשל הדוגמא הבאה, הלקוחה מדף הערך על דיאגרמות עוגה בויקיפדיה:

    שלוש העוגות נראות מאוד דומות, אבל אם תבחנו אותן בעיון, תראו שיש ביניהן הבדלים. הפרוסה השחורה גדולה יותר בעוגה A, למשל. אבל באיזה עוגה הפרוסה הירוקה גדולה יותר? האם הפרוסה הכחולה שווה בגודלה לפרוסה האדומה? מהי הפרוסה הגדולה ביותר בעוגה B?
    אפשר כמובן לשבת ולפענח אט אט את כל ההבדלים. אבל האם לא עדיף להשתמש בתצוגה ברורה יותר? (לחצו על הלינק כדי לראות תצוגה ברורה יותר של נתונים אלה).

    תכנת אקסל ודומותיה מציעות עוד שכלולים לדיאגרמת העוגה – העוגה התלת מימדית פופולרית מאוד. הנה תצוגת נתוני האוהדים בעוגה תלת מימדית:

    הפרוסה הצהובה נראית לפתע קטנה יותר, כיוון שהעין תופסת את הדפנות הקדמיות של הפרוסות האחרות כחלק משטחן. הנה דוגמא קיצונית יותר, שמצאתי באינטרנט (לא זוכר היכן):

    החלק הכהה בדיאגרמה הימנית זהה בגודלו לחלק הכהה בדיאגרמה השמאלית, אבל הוא נראה הרבה יותר גדול.
    הנה דוגמא נוספת, הפעם אמיתית, שממחישה את הבעייתיות.

    דיאגרמה זו מציגה את הסיבות להפסקת הפיתוח של תרופות פוטנציאליות בבריטניה. פיתוחן של 40% מהמולקולות הופסק עקב בעיות פרמקוקינטיות, ופיתוחן של 29% מהמולקולות הופסק עקב חוסר יעילות טיפולית. נראה כאילו לשתי הסיבות יש משקל דומה, ואלי אפילו משקל הפרמקוקינטיקה קטן יותר. זאת כיוון שהפרוסה הצהובה נמצאת בקדמת התמונה ולכן נראית גדולה יותר.
    עד כמה ההטעיה חמורה? ניתן למדוד את השטח בתמונה שתופסת כל פרוסה על ידי ספירת פיקסלים (עשיתי זאת בעזרת תכנית קטנה שכתב עבורי ידידי שי אלקין). מתברר כי השטח הצהוב תופס כ-50% משטח הדיאגרמה, השטח האדום תופש 32% בלבד מהשטח הכולל של הדיאגרמה. המסר שהעבירה הדיאגרמה שונה לחלוטין מזה שמעבירים הנתונים המספריים. למרה הצער, דיאגרמה זו הוצגה בפתיחת הרצאה על חשיבות המחקר הפרמקוקינטי.

    למרות שדיאגרמת העוגה מאוד משכנעת, הרי שברוב המקרים אינה מצליחה להציג את הנתונים בצורה ראויה, בדרך כלל מקשה על תפיסת מהירה של משמעותם, ולעיתים אף עלולה להעביר מסר שגוי. קיימות דרכים טובות יותר להציג נתונים באופן גרפי. העדיפו אותן על פני העוגה. עוגה – רק בבית קפה!

    תחרות כדור הבדולח – הזוכים

    לאחר שכל הנתונים הדרושים לקביעת הזוכים בתחרות כדור הבדולח נאספו, זה הזמן להכריז על הזוכים!

    את התשובות של כל אחד מהמשתתפים והניקוד שקיבלו בגין כל תשובה ניתן לראות בקישור זה, והנה גם קישור אל הדירוג הסופי.

    במקום הראשון זכה עמית גל, במקום השני זכה דותן צור, ובמקום השלישי זכה צור קרליץ.

    הפרסים, תלושים לקניית ספרים מתנת האיגוד הישראלי לסטטיסטיקה, יוענקו בכנס השנתי של האיגוד, שייערף שייערך בתאריך 25.5.2011 בתל אביב.

    אני מברך את הזוכים ומודה לכל המשתתפים בתחרות.