ארכיב עבור 'אותי זה מצחיק'

תמונה אחת שווה אלף מלים

הטור של דילברט מהיום מדגים כיצד הצגה גרפית טובה יכולה להעביר את המסר בצורה אופטימלית. לחצו על התמונה כדי לראות אותה בגודל מלא באתר דילברט.קומ

הצגה גרפית אופטימלית

וברצינות – דיאגרמת עוגה (pie chart) היא אחת ההצגות הגרפיות הגרועות ביותר שיש, ומומלץ מאוד לא להשתמש בהן (הערה לעצמי: צריך לכתוב בהזדמנות רשימה על הנושא).

זוית מבט נוספת על מתאם וסיבתיות

לחצו על התמונה כדי לראות אותה (ואת הפאנצ'ליין, שמופיע בתור כיתובית לתמונה) בגודל מלא באתר xkcd, שם פורסמה היום.

מתאם וסיבתיות

כמובן שהתרעתי ואמשיך להתריע כאן בבלוג כי מתאם אינו מעיד על סיבתיות. בכל מקרה, במצב המתואר בקריקטורה זו יש בעיה סטטיסטית נוספת – גודל מדגם קטן מדי.

מה (למשל) יכול להיות בעייתי במטה-אנליזה

מטה-אנליזה היא טכניקה סטטיסטית בה לוקחים תוצאות סופיות ממספר ניסויים/מחקרים, ומסנתזים אותם למסקנה כוללת אחת. לדעתי האישית זוהי טכניקה בעייתית למדי (למרות שבחלק הדיונים על סקרי הבחירות שנערכו כאן הפנו אותי קוראים נלהבים אל אתרים שביצעו מטה-אנליזה לתוצאות הסקרים שנערכו לקראת הבחירות לנשיאות ארה"ב).

היום, כשקראתי את העדכון האחרון של chance news, ראיתי שם הפניה לקריקטורה ישנה מהניו-יורקר שמדגימה את הבעייתיות בנושא:

misuse of meta analysis

ומתברר שגם לבדיחה הזו יש מימוש במציאות (בעיירה ניו-קויאמה שבקליפורניה):

(בויקיפדיה אומרים שהשלט הומוריסטי, אני מקווה שזה נכון).

יישומי הסטטיסטיקה באהבה

לחצו על התמונה כדי לראות אותה (ואת הפאנצ'ליין, שמופיע בתור כיתובית לתמונה) בגודל מלא באתר xkcd, שם פורסמה היום.

 statistical boyfriend

 

הבדיחה, אגב, עדיין משעשעת אך ישנה. באתר של ה-ASA, האיגוד האמריקני לסטטיסטיקה,ניתן לקנות טי-שרט עם הכיתוב "I'm statistically significant", ולשני בני הגדולים אכן היו חולצות כאלה, שקניתי להם בכנס ה-ASA נערך בבולטימור בקיץ 1999.

חולצה לילדי סטטיסטיקאים

נפלאות המחקר – שיעור באחוזונים

הנה מחקר נפלא שתוצאותיו פורסמו ב-Scientific Ynet (ותודה לעריסטו מפורום מתמטיקה בתפוז), שקבע כי "למעלה משליש מהילדים בארץ – בעודף משקל":

נמצא כי בממוצע לאורך שבע שנות המחקר 29 אחוז מבני השש היו בעלי עודף משקל (משקלם היה גבוה מהאחוזון ה-85, כלומר גבוה מ-85 אחוז מבני גילם). מחציתם אף הוגדרו כסובלים מהשמנה (שקלו יותר מ-95 אחוז מבני גילם).

ואני לתומי חשבתי כי רק ל-15% מהאוכלוסיה משקך הגבוה מהאחוזון ה-85, ורק ל-5% משקל הגבוה מהאחוזון ה-95. נו, מה אני כבר יודע?

זה לא שוטר, זה בנק

אי שם בסוף שנות השבעים או תחילת שנות השמונים, הייתה תקופת פריחה לסניפי הבנקים הישראל. סניף בנק נפתח תחת כל עץ רענן, ובמקומות שבהם שלא נפתחו סניפים אפשר היה לראות שלטים המכריזים כי "כאן בקרוב ייפתח סניף בנק". התופעה הונצחה באופן משעשע ביותר באחד המערכונים של הגשש החיוור.

ומדוע אני טורח להזכר בכל זה? ביום חמישי האחרון נסעתי עם משפחתי לנופש באילת. בדרך עצרנו להתרעננות בתחנת הדלק שעל כביש 6, והנה מה שמצאתי באחד מהחדרים הפרטיים של בית הקפה המקומי:

כאן ייפתח בקרוב סניף בנק

שיחה שנצפתה אי שם במישור המרוכב

תפוצת מושגי החנוכה בפרוייקט בן יהודה

הקדמה

ביום רביעי שעבר נערך מפגש של משתתפי פורום תרבות עברית בתפוז. כמקובל בפורום, נקבע למפגש נושא, המקרה זה נסים, וכל משתתף התבקש להביא חפץ או תוכן כלשהו שקשור לנס, מתוך התרבות העברית. ישבתי וחשבתי על החפץ או התוכן שאביא עימי. מאחר ובין עיסוקי (מלבד היותי חובב התרבות העברית) אני גם סטטיסטיקאי וגם נוטל חלק בפעילות של פרוייקט בן-יהודה, החלטתי “לעשות סטטיסטיקה” ולבדוק בכמה מדפי הפרוייקט מופיעה המלה “נס” והטיותיה, כגון “נסים” וכולי. מהר מאוד התברר לי שזה לא מספיק. אי אפשר לבוא למפגש הפורום ולספר כי המלה “נס” מופיע ב-X מדפי הפרוייקט ולהודיע כי בכך יצאתי ידי חובתי. הרחבתי את נושא המחקר שלי לבדוק את תפוצת מושגי החנוכה בדפי הפרוייקט, ומייד תוכלו לחזות בתוצאות. לא, הגרפים לא אפקטיביים במיוחד (סתם גרפים מאקסל), ובכל זאת אפשר ללמוד מהם משהו. הרי הפרוייקט מכיל יצירות ספרותיות שמחבריהן הלכו לעולמם לפני 70 שנה או יותר (כלומר ב-1937 לכל המאוחר), ומכך ניתן ללמוד משהו על מקומו של  חג החנוכה בתרבות העברית בתקופה שעד 1937. הנה המצגת לפניכם (אם כי הפרשנות שאספק מצומצמת, ותהיה מוגבלת להערות מתחכמות ברוח חוש ההומור הייחודי שלי).

מושג החנוכה ומושגים נלווים

ראשית, בדקתי (בעזרת מנוע החיפוש של גוגל) בכמה דפים מדפי הפרוייקט מופיעה המלה חנוכה, וכן מושגים נלווים לחנוכה, כגון אור, נס מרד וכדומה. התוצאות לפניכם (ה:

untitled1

נסים

אם מחפשים נס, מוצאים לא מעט, יותר מנס אחד גם יותר קשה למצוא, פך השמן כמעט ולא נמצא:

untitled4

נרות ואור

חיפשתי אחרי מושגים רבים הקשורים בנרות ואור, אך כולם מתגמדים בפני האור עצמו.

untitled3

מאכלים

בחיפוש אחרי מאכלים ומוצרי מזון הקשורים לחנוכה, הגעתי לתובנות הבאות: שמן יש הרבה, אך שמן זית נדיר יותר. לביבות יש, לביבה יש פחות, ולטקעס אין בכלל. סופגניות יש שתיים, סופגניה בודדת אין, מה שתומך בטענה כי סופגניה אחת פשוט לא מספיקה.

untitled5

מקומות

מכל המקומות הקשורים לחג, רק ירושלים מופיעה באופן משמעותי. מודיעין ומקומות בהם התרחשו קרבות מפורסמים זוכים לאזכורים בודדים, אם בכלל.

untitled6

קבוצות אנשים

מכבים, חשמונאים, יוונים ומתייוונים, כל קבוצות אנשים אלה קשורות לחג, אך בספרות העברית המוקדמת תפוצתם דלה:

untitled7

אישים – המכבים מול היווני

אם לא מכבים ויוונים כקבוצות, מה בנוגע לאישים עצמם? הנה שכיחות הדפים בהם מופיעים אנטיוכוס, מתתיהו והמכבים עצמם (כמון שיהודה מופיע יותר מכולם, בזכות אליעזר):

untitled8

 

חג שמח לכולם!

Poll smoking

לקראת הבחירות הקרבות, הנה תזכורת מהבחירות לסנאט והקונגרס של ארה"ב שנערכו בשנת 2006 . דייב גורמן, הפרשן לענייני סטטיסטיקה של התכנית The daily show מנתח את הסקרים שנערכו לקראת בחירות אלו. התובנה העיקרית: עדיף להיות סטטיסטיקאי בשומר העתיקה.

סקרים טלפוניים: דיווח תוצאות בדילברט

5652.strip

Dilbert survey