חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור תגית חינוך

סטטיסטיקה והסתברות לגיל הרך

שום דבר חדש או מפתיע בפוסט הזה, שום דיון על תובנות (לא שאין כאלה), רק קצת חומר חימום ללב.

בגן של בני הצעיר[1], כמו בהרבה גני ילדים אחרים, יש בכניסה לגן לוח אליו מצמיד כל ילד שלט קטן עם שמו בכל בוקר, מין לוח נוכחות כזה. בכל שבוע, משתנה השאלה שבראש הלוח, ובהתאם לכך משתנה התצורה של לוח הנוכחות. כך, למשל, נוצרה דיאגרמת עמודות של התפלגות מספר האותיות בשמות ילדי הגן:

pashoshname

לקראת חג החנוכה, הונח ליד הלוח סביבון, וכל ילד או ילדה מסובבים את הסביבון, ומצרפים את שמם לעמודה המתאימה לאות שעליה "נעצר הסביבון"[2]:

pashoshsevivon

הערות
  1. גן פשוש, עם הגננות הנפלאות תמי וסווטה []
  2. כאן יכול לבוא דיון על ההתפלגות האחידה שאמורה להתקבל ועל מבחני טיב ההתאמה, אבל אוותר לכם על זה. []

כמה הערות מאוחרות בנושא פרסום ציוני המיצב

ביום חמישי האחרון (23.5.13) השתתפתי בכנס האיגוד הישראלי לסטטיסטיקה. במושב הסיום של הכנס נערך פאנל בו השתתפה, בין היתר, פרופ' מיכל בלר, המנכ"ל הפורשת של הרשות הארצית למדידה והערכה (ראמ"ה). הפאנל היה אמור לעסוק ב-"אתגרים בפרסום פומבי של נתונים על מערכות ציבוריות", אולם בפועל הוקדש רובו להתלהמות חוצבת להבות של פרופ' בלר כנגד ההחלטה להנגיש לציבור את תוצאות מבחני המיצב. ההחלטה התקבלה, אגב, על ידי שופטי בית המשפט העליון של מדינת ישראל, שכמובן אינם מומחים לחינוך כמו פרופ' בלר עצמה. אני ממליץ לקוראים לקרוא את סקירת החלטת בית המשפט העליון בנושא שכתבה קרן ילין-מור, שהופיעה בבלוג "הטרקלין".

הנושא הוא אכן ישן. החלטת בית המשפט התקבלה לפני שבעה חודשים, ותוצאות המיצ"ב פורסמו לציבור הרחב לפני יותר מחצי שנה. מלים רבות נכתבו על כך מאז, ולכן אתייחס רק למספר קטן של טענות שהועלו במהלך הדיון בפאנל.

טענה מרכזית של פרופ' בלר היא שפרסום הציונים, ובעקבותיהם פרסומים בעיתונות ודירוגי בתי ספר שהופיעו באתר מדלן, גורמים ויגרמו להונאות בבחינות/תהליך המדידה מצד בתי הספר, המורים והתלמידים. טענה זו שגויה ומטעה, והסיבה היחידה שאני יכול להעלות בדעתי לכך היא שפרופ' בלר אינה מבחינה בין סיבה ו-… לא ברור מה.

הסיבה להונאות בבחינות היא קיום הבחינות עצמן, והחשש של בתי הספר והמורים כי ייפגעו עקב תוצאות הבחינות. גורלם של מנהלי בתי הספר ומוריהם נתון בידי משרד החינוך, לא בידי הציבור.

גם התמקדות של אנשי מערכת החינוך בשיפור המדדים ולא בשיפור התופעות שגרמו למדדים מספריים אינה קשורה בעצם הפרסום, אלא בעצם קיום המדידה. זו בעיה שהיה צריך לצפות מייד עם ההחלטה על קיום מבחני המיצב, ובמקביל היה צריך לחשוב על דרכים להתמודדות איתה. אני מניח, או לפחות רוצה לקוות, שחשיבה כזו נעשתה.

טענה שניה שהועלתה היא העובדה שאתרים מסוג אתר מדלן (שמפעיליו הם חבורה של סטודנטים למדעי המחשב שאינה מבינה בחינוך, לדעת בלר), פרסמו "טבלאות ליגה" בה ערכו השוואה ארצית בין בתי הספר. זה היה יכול להמנע, לדעת בלר, לו לא פורסמו התוצאות.

ובכן, השוואה ארצית ("טבלת ליגה" כפי שמכנה זו בלר) נערכה על ידי ראמ"ה עצמה, ותוצאות השוואה זו מופיעה בדוחות עצמם שפורסמו לציבור. הרי בדו"ח עצמו מופיע ממוצע הציון במבחן מול הממוצע הארצי (וגם סטיות התקן), וכן מופיע העשירון בו נמצא בית הספר. האם זו אינה השוואה? ההשוואה והדירוג כבר נעשו, על ידי ראמ"ה בכבודה ובעצמה, אבל בכל דו"ח בית ספרי מופיעה רק פיסת מידע קטנה מטבלת הליגה. בלר אכן ניסתה למנוע את הצגת התמונה השלמה על ידי כך שהגישה לדו"חות המפורסמים היא קשה יחסית, ניתן להוריד רק דו"ח של בית ספר אחד בכל פעם, והנתונים מופיעים בקובצי PDF, שאינם מאפשרים קריאה נוחה של נתונים. מזל שיש כמה סטודנטים למדעי המחשב שיכולים להתמודד עם המכשולים האלה ולהביא לציבור את התמונה השלמה.

טענה נוספת שהועלתה במובלע היא שהערכת בית ספר אינה צריכה להיות תלויה רק בנתונים כמותיים של תוצאות מבחנים, אלא במכלול, שחלקו מורכב מנתונים שאינם ניתנים לכימות. נכון, אז מה? פרסמו נא לציבור גם את הנתונים הבלתי כמותיים.

עם טענה אחת אני בכל זאת מסכים: אנשי אתר מדלן נתנו לכל בית ספר דירוג שהוא ממוצע העשירונים במקצועות הליבה השונים מוכפל ב-10. לדוגמא, לבית ספר שדורג בעשירון 8 במבחן האנגלית ו-7 במבחן מתמטיקה, דירוג מדלן הינו 75. בלר, וגם ד"ר חגית גליקמן, הסטטיסטיקאית של ראמ"ה, טענו כי מדד זה בעייתי מבחינה מתודולוגית. אני מסכים – מיצוע עשירונים הוא בעייתי, חסר ביסוס תיאורטי סטטיסטי, ופרדוקס סימפסון עלול להרים את ראשו. אבל מכאן ועד הטענה שלמדד דירוג מדלן אין כל משמעות הדרך רחוקה. זו היוריסטיקה סבירה בהחלט לדעתי, גם אם המתודולוגיה לקויה. אפשר כמובן לעשות טוב יותר. אני מקווה שראמ"ה תפרסם, כפי שהציע טל גלילי, את כל הנתונים בפורמט נוח להורדה ועיבוד, וכך יתאפשר לציבור לנסות גישות אחרות להשוואה בין בתי הספר. מאחר ובציבור הרחב יש גם סטטיסטיקאים, אני מניח שחלקם מכירים שיטות סטטיסטיות (ניתוח מרכיבים ראשיים, factor analysis, MDS הם כמה דוגמאות) שיתנו מדד השוואתי טוב יותר, וכך גם אנשי ראמ"ה שטענו כי "בלתי אפשרי" לבנות מדד משולב כזה ילמדו משהו.

הטענות של בלר בפאנל הן לא יותר מאשר בכי על כך שהסוסים ברחו מהאורווה, וזאת לאחר שבלר עצמה, כמנכ"ל ראמ"ה, פתחה את דלתות האורווה והאיצה בסוסים לצאת ממנה. ברגע שמעמידים את כלל התלמידים בבתי הספר בארץ בפני מבחן אחיד כמבחן המיצ"ב, נעשתה ההשוואה בין בתי הספר, והופנתה תשומת הלב של בתי הספר וצוותיהם מהשגת מטרות חינוכיות אל שיפור תוצאות המדדים הכמותיים. הנזק נעשה. השאלה היא רק האם יש לפרסם את התוצאות לציבור או לא, וכאן בהחלט צריך להעדיף את העקרון הדמוקטי של שקיפות הממשלה לציבור על פני דעתה של בלר וראמ"ה. בלר אמרה כי בעקבות הוראת בית המשפט העליון נשקל ביטול מבחני המיצ"ב. לו יהי.

מקבץ 5

ושוב, אוסף לינקים בנושאי הבלוג שהצטברו מאז המקבץ הקודם.

  • המקבץ הקודם הסתיים בלינק לפוסט בבלוג "עבודה שחורה", שהודיע על העובדה הלא מפתיעה כי התפלגות השכר בישראל מוטה, או יותר נכון, אינה סימטרית. האמת, זה קצת כמו להודיע שכלב נשך אדם. זה המצב בכל התפלגויות השכר בכל מקום, וזאת כיוון שהשכר מוגבל מלמטה (על ידי שכר המינימום, או על ידי האפס) אך אינו מוגבל מלמעלה, ותיאורטית (וגם מעשית) יש קבוצה קטנה של מקבלי שכר גבוה במיוחד שיוצרים "זנב" להתפלגות. כל זה לא מעניין במיוחד את שלומית יהב, יועצת כלכלית לעת מצוא. היא פירסמה בווינט כתבה בה הוכיחה באותות ובמופתים כי משפחה שבה שני בני הזוג מרוויחים את השכר הממוצע במשק יכולה "לחיות טוב" בארצנו. אתם יודעים מה, היא גם צודקת. כי השכר הממוצע המשק גבוה מאוד, ומי ששכרו שווה לשכר הממוצע ניצב בגאון בעשירון השלישי, כלומר, 70% מהאוכלוסיה מרוויחים פחות מהשכר הממוצע. הבעיה היא שמספר המשפחות בהן שני בני הזוג עובדים ומרוויחים את השכר הממוצע במשק זניח. אם אחד מבני הזוג מרוויח את השכר הממוצע, יש סיכוי יותר גדול כי השני מרוויח פחות מכך. כן, גם אם לוקחים בחשבון שיש תלות בין השכר של שני בני הזוג, וזאת כיוון שהשכר הממוצע למשפחה הוא פחות מפעמיים השכר הממוצע במשק. דובי קננגיסר כתב היטב על הכשלים של גברת יהב, והעריך כי התחשיב שלה נכון לגבי לא יותר מ- 10% ממשקי הבית בישראל. השורה התחתונה: אם אתה בעשירון העליון, אתה באמת יכול לחיות טוב בארץ הזו.
  • ראיון עם פרופסור אילון לינדנשטראוס, שזכה במדליית פילדס, הפרס היוקרתי ביותר במתמטיקה.
  • אין שידור טלוויזיה של משחק כדורסל, בייסבול או פוטבול (אמריקני) שאינו מלווה בשפע של נתונים סטטיסטיים אודות המתרחש במשחק. יותר מכך: ניתוחים סטטיסטיים מהווים היום חלק מתהליך קבלת ההחלטות בכל ארגון ספורט בענפים האלה. ומה קורה בכדורגל? לא הרבה. הניו יורק טיימס מנסה לברר מדוע. חלק מהסיבות: האוהדים לא מעוניינים. הקבוצות לא מתעניינות. קשה יותר להשיג נתונים סטטיסטיים על משחקי כדורגל, בין היתר בגלל האופי השונה של המשחק.
  • לא רק לענף הכדורגל יש בעיות עם הסטטיסטיקה. גם לרופאים (שוב, ידיעה מהסוג של "כלב נשך אדם"). אתר ABC מדווח על מחקר שפורסם לאחרונה לפיו רוב הרופאים אינם מבינים נתונים סטטיסטיים אודות תופעות לוואי אפשריות של תרופות. עורכי המחקר מאשימים, איך לא, את חברות התרופות. האפשרות שרופאים ילמדו קצת סטטיסטיקה לא עולה בדעתם.
  • בגליון ספטמבר של Amstat News, המגזין החודשי של האיגוד האמריקני לסטטיסטיקה – ראיון עם שלושה בלוגרים סטטיסטיקאים: אנדרו גלמן, נתן יאו וקייזר פאנג.
  • ובגליון אוגוסט מובאים הזוכים בתחרות הפוסטרים השנתית של האיגוד האמריקני לסטטיסטיקה – הנערכת בקרב תלמידי בתי הספר בארה"ב. מה שמראה שלא צריך להיות רופא, או סטטיסטיקאי, כדי "לעשות" סטטיסטיקה טובה. צריך רק לרצות. הנה טעימה: הזוכה במקום הראשון בקרב תלמידים מכיתות א עד ג:

יום עיון בנושא אוריינות סטטיסטית

הפקולטה לחינוך של אוניברסיטת חיפה עורכת יום עיון בנושא: "בין אנשים למספרים: אוריינות סטטיסטית במאה ה-21".

האירוע מתקיים לרגל פרסום ספרם של דר' דני בן-צבי ופרופ' ג'ואן גרפילד: "Developing Students' Statistical Reasoning ".

יום העיון יתקיים ביום שני, 23.3.2009 בשעות 16:00 – 19:00באוניברסיטת חיפה. לפני יום העיון תתקים סדנא בת שעה על פיתוח חשיבה סטטיסטית בגיל הצעיר בסביבה עתירת טכנולוגיה.

למעוניינים, תכנית הכנס המלאה נמצאת כאן (קובץ pdf), וניתן להירשם בלינק זה.

על משמעות המידע שבסקרי הבחירות

דובי קננגיסר כתב בבלוג שלו, תחת הכותרת "האם מידע הוא חסר משמעות?" הסבר מפורט על מנגנון לפיו פרסום תוצאות סקרים יכול להשפיע על המציאות (הפוליטית, ובכלל). אני מוכן להסכים עם רוב הטיעונים שלו. אני מסכים כי למידע יש משמעות. אני מסכים כי חשיפה למידע יכולה להשפיע על החלטות של אנשים, ובפרט, חשיפה למידע המתקבל מסקרי בחירות, יכולה להשפיע על החלטות של בוחרים בקשר לאופן הצבעתם בבחירות. אני מסכים לחלוטין (ותמיד טענתי זאת) עם טענתו של דובי כי יש בעיה אתית חמורה ומתמשכת בעצם הצגת המידע שבסקרים כפי שהוא מוצג בישראל, וכי שותפים לבעיה הזו גם אמצעי תקשורת וגם סוקרים. הכל נכון.

אבל יש שתי שאלות גדולות שדובי לא עונה עליהן.

באופן פילוסופי אפשר לטעון שכל דבר משפיע על המציאות, וזה בסך הכל נכון (במובן מסויים). נו, אז מה? אז גם סקרים משפיעים על המציאות (דרך המנגנון שדובי תיאר, ו/או דרך כל מנגנון אחר). אין מחלקות. השאלה החשובה באמת שצריך לשאול היא מה מידת ההשפעה שיש לסקרים על המציאות.

לומר שהסקרים מייצרים מציאות, זה לומר שמידת ההשפעה שלהם היא גבוהה ביותר. על סמך מה אפשר לומר את זה? האם ניתן להעריך מהי מידת ההשפעה של הסקרים על המציאות הפוליטית ביחס למידת ההשפעה שיש להחלטה על פעולה צבאית שראש הממשלה מקבל כמה שבועות לפני הבחירות? ביחס להודעה לעיתונות, יומיים לפני הבחירות, על המצאה גאונית שתשנה את העולם? ביחס לפיגוע שמתרחש יום וחצי לפני מועד הבחירות? אני משוכנע שתסכימו איתי כי כל אחד מהאירועים האלה השפיעו על תוצאות הבחירות שהתרחשו זמן קצר לאחר מכן, יותר מכל סקר, ויותר מכל הסקרים ביחד. ובוא לא נשכח כי הגורם העיקרי המשפיע על המציאות הפוליטית ותוצאות הבחירות הוא התפקוד של הממשלה היוצאת.

לאחר שנצליח לכמת (או לפחות להעריך) את מידת ההשפעה שיש לסקרי הבחירות (ולסקרים בכלל) על המציאות, נוכל לענות של השאלה השניה: כיצד לאזן בין הנזק שהסקרים גורמים ובין התועלת שהם מביאים, אם בכלל יש צורך לעשות זאת.

אם נחליט שיש צורך לעשות משהו בעניין, כבר הצבעתי על הפתרון בעבר, ואצביע עליו שוב.

בטווח הקצר יש לדרוש מעורכי הסקים וממי שמפרסם את תוצאותיהם להקפיד לשמור על אתיקה מקצועית. בנוסף, אפשר וצריך לדרוש מכלי התקשורת לקיים את הוראות תיקון מספר 22 לחוק הבחירות (דרכי תעמולה) הקובע כללים ברורים לאופן פרסום תוצאות סקרי בחירות, ולמידע שעל הסוקר למסור יחד עם תוצאות הסקר. אפשר גם לאכוף את החוק (לתשומת לבו של  הקורא אליעזר ריבלין).

בטווח הארוך, הפתרון הראוי טמון בחינוך. יש ללמד את עקרונות הסטטיסטיקה וקבלת ההחלטות בבתי הספר ובאוניברסיטאות באופן מקיף ויסודי. זה לא פתרון קל, ותוצאותיו יורגשו רק בעוד מספר לא מועט של שנים, אבל זהו הפתרון הרציונלי היחיד