ויזואליזציה של נתוני יחס חוב/תוצר
האם אינפוגרפיקה היא תמיד אינפורמטיבית? לא בהכרח. לעיתים קרובות תצוגה גרפית בסיסית מאפשרת הרבה יותר תובנות בהשוואה לויזואליזציות מתוחכמות
אלוהים משחק ביקום בקוביות
האם אינפוגרפיקה היא תמיד אינפורמטיבית? לא בהכרח. לעיתים קרובות תצוגה גרפית בסיסית מאפשרת הרבה יותר תובנות בהשוואה לויזואליזציות מתוחכמות
חוקרים מאוניברסיטת קולורדו ערכו ניסוי כדי לבדוק האם צלחות עם ציורי ירקות ופירות גורמות לילדים לאכול יותר ירקות ופירות. התכנון של הניסוי בעייתי: יש התעלמות ממקורות של שונות ולכן מתקבלים רווחי סמך צרים שאינם משקפים את ההבדלים בין הילדים. כמו כן, בניסוי אין קבוצת ביקורת. לא ברור האם לתוצאות שהתקבלו יש משמעות מבחינה רפואית או תזונתית.
במחקר שנערך על הפערים הדיגיטליים בישראל הוצגו גרפים בעייתיים ומטעים. ברשימה זו אני מציג שניים מהגרפים האלה, מסביר את הבעייתיות, ומדגים כיצד יש להציג את הנתונים בצורה נכונה.
שאלה במבחן בקורס “חשיבה סטטיסטית בפסיכולוגיה” מציגה את כל מה שרע בשימוש לא נכון בסטטיסטיקה, ובאותו הזמן מדגימה איך לא ללמד חשיבה סטטיסטית וגם איך לא לבדוק האם לסטודנטים יש כישורי חשיבה סטטיסטית.
נתונים סטטיסטיים מבוססים בדרך כלל על מדגמים, ובמדגמים, גם מדגמים מייצגים, יש אלמנט של אי ודאות. עד כמה ניתן לסמוך על התוצאות המתקבלות מהמדגם? את זה אפשר לכמת, ולתת מדד למידת אי הודאות של התוצאות המדווחות. הנה דוגמא מלאכותית אבל קלאסית: במקום עבודה מסויים השכר הממוצע הוא 10400 ₪. יפה, לא? בטח טוב לעבוד שם….
“לקרוא לסטטיסטיקאי לאחר שהניסוי התבצע זה כמו לבקש ממנו לבצע ניתוח שלאחר המוות. לכל היותר הוא יוכל לומר מה הייתה סיבת המוות” – רונלד פישר. כשמדברים בסטטיסטיקה על תכנון, מדברים בדרך כלל על תכנון ניסויים. ((תכנון איסוף הנתונים ותכנון הניתוח הסטטיסטי הם חלק מתהליך תכנון הניסוי. )) קשה להביא דוגמאות למקרים של כשלים בתכנון ניסויים,…
הסטטיסטיקה מבוססת על מדגמים. מדגם לא מייצג מוביל בדרך כלל להטיה בנתונים הנאספים ולמסקנות שאינן תקפות. לרוב אין זה מעשי לאסוף את כל הנתונים הדרושים למחקר מסויים ((למשל נתוני השכר של כל אזרחי מדינת ישראל)), ולכן יש להסתפק במדגם – כלומר בנתונים חלקיים. המדגם צריך לאפשר הסקה לגבי כלל הנתונים. אם המדגם אכן מאפשר זאת,…
p-hacking ((אשמח להצעות לתרגום לעברית)) היא הפרקטיקה של חתירה לתוצאה מובהקת, ובאמירה פופולרית “לענות את הנתונים עד שיודו”. לעיתים הדבר נעשה מחוסר מודעות, ולעיתים בכוונה תחילה. יש הרבה דרכים להגיע לתוצאה מובהקת. אפשר לנסות לנתח את הנתונים בכל מיני שיטות סטטיסטיות. אפשר לאסוף נתונים, לנתח אותם, ואז לפרסם אם מתקבלת תוצאה מובהקת, ואם לא, לאסוף…
בתהליך הסטטיסטי של בדיקת השערות מוצבות זו מול זו שתי השערות. ההשערה הבסיסית, המכונה השערת האפס, מתארת את הידע הקיים (ידע מדעי או אחר), ומולה ניצבת השערה אלטרנטיבית, המייצגת תיאוריה חדשה. כדי להוכיח כי התיאוריה החדשה נכונה, על החוקר להציג ראיות מובהקות ומשמעותיות שיביאו לדחיית השערת האפס לטובת ההשערה האלטרנטיבית. מה קורה אם אין ראיות…
בנושא המתאם והסיבתיות דנתי רבות ((זה היה הפוסט הראשון שהופיע בנסיכת המדעים!)). יש הרבה דוגמאות משעשעות: מתאם בין יבוא לימונים לבטיחות בדרכים, בין צבעה של מכונית והסיכוי כי תהיה מעורבת בתאונת דרכים, ובין מחזורי הירח ומחירי המניות. קוריוזים כאלה בדרך כלל לא גורמים נזק ((אם כי עלולים להיגרם הפסדים כספיים למי שישקיע את כספו על…