ארכיב עבור 'האנשים שמאחורי הסטטיסטיקה'

מי בעד חיסול התלושים?

מאמר מעניין שהופיע בסופ"ש במוסף "הארץ" תחת הכותרת "מי בעד חיסול התלושים?", מספר על ההיסטוריה של סקרי דעת הקהל בישראל:

"סקרי דעת קהל הם באמת יבוא מאמריקה, אבל נמצאים איתנו כבר יותר מ-60 שנה. "מפתיע לגלות שחקר דעת הקהל בישראל קדם להקמת המדינה", כתבה ד"ר דנה בלאנדר, חוקרת במכון הישראלי לדמוקרטיה, במאמר שהתפרסם באתר של המכון. החלוץ של המחקר החברתי-שימושי בארץ היה פרופ' אליהו (לואיס) גוטמן, שממניעים ציוניים ויתר על קריירה אקדמית בארצות הברית ובא ארצה ביולי 47'. כעבור חצי שנה, בעיצומה של מלחמת העצמאות, יחד עם אוריאל פואה, חוקר במדעי החברה שבא מאיטליה, הקים גוטמן בירושלים יחידת מחקר פסיכולוגית קטנה, שהורכבה ממתנדבים ועסקה בחקר דעת קהל בשביל מחלקת ההסברה של "משמר העם"."

פורסם לראשונה באתר "רשימות" בתאריך 17 באוגוסט 2008

הסטטיסטיקה בתעשייה – לאן?

נהוג לפתוח כל מאמר או הרצאה באנקדוטה משעשעת או באמירה פילוסופית. המאמר הבא, שמבוסס על הרצאה שנתתי בסמינר האיגוד הישראלי לסטטיסטיקה, מתבסס על נסיוני בתעשייה (בעיקר התעשיה הפרמצבטית) בעשר השנים האחרונות, ועל האמירה הבאה, המיוחסת לסופר המדע הבדיוני ה. ג'. וולס:

ה. ג'. וולס (1866-1946) חזה כי בחברה המודרנית יכולת חשיבה סטטיסטית תהיה חיונית באותה מידה כמו יכולות הקריאה והכתיבה

"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write." – H. G. Wells

בכל הנוגע לתעשייה הפרמצבטית, העתיד אותו חזה וולס כבר כאן. הסטטיסטיקה מהווה נדבך מרכזי בכל תהליכי המחקר, הפיתוח, והייצור של התעשיה. איש אינו מעלה על דעתו לצאת לניסוי קליני ללא ליווי סטטיסטי צמוד, ובשנים האחרונות הדרישה לתמיכה סטטיסטית גם בשלבי פיתוח מוקדמים יותר, וגם בתהליכי הייצור גוברת, בד בבד עם עליית המודעות לערך המוסף שמביאה הסטטיסטיקה עמה. כמובן, ככל שמתרחב השימוש בסטטיסטיקה כך גדלה הנחיצות של יכולת חשיבה סטטיסטית מצד השותפים לתהליך. אני חושש שלמרות שהעתיד שניבא וולס כבר כאן, יכולות החשיבה הסטטיסטית עדיין לא מספיקות עבור המציאות החדשה.

לפני זמן מה, בבוקרו של יום א' בשבוע, נערכה במקום עבודתי ישיבה שעסקה בעניינים שברומו של עולם. בתחילת הישיבה דווח כי אחד המשתתפים, רופא במקצועו, לא יוכל להשתתף מכיוון שהינו חולה. מייד הועפו באוויר כל מיני הערות בסגנון "הסנדלר הולך יחף" וכדומה, ואני התבדחתי והערתי כי 40% מימי המחלה מדווחים בימי ראשון או חמישי. ההערה גרפה צחוק רועם, אך מייד לאחר מכן התפתח דיון בנושא ימי המחלה, וממנו התחוור לי כי הבדיחה כלל לא הובנה, והצחוק התעורר מהסיטואציה בה סטטיסטיקאי שולף בביטחון עצמי נתון סטטיסטי מהשרוול. בסופו של דבר מצאתי את עצמי נאלץ להסביר את הבדיחה לקהל, דבר שחיסל כל סיכוי לכך שמישהו יהיה משועשע מהבדיחה, וגרם לי להרהר בהמשך היום על המסר שעובר ממני ללקוחות שלי.

עלי לציין כי הבדיחה אינה בדיחה מקורית שלי, והיא כבר נזכרה בכתביו של סקוט אדמס, יוצר הסאגה המודרנית "דילברט". בקריקטורה המובאת כאן אחד הנוכחים דווקא מבין את החשיבה המגוחכת שמאחורי טרוניית הבוס מחודד השיער, אולם העובדים הותיקים יודעים כי חוש הומור המבוסס על "קומון סנס", שלא לדבר על חשיבה סטטיסטית, אינו נמנה עם התכונות של הבוס.

Dilbert Sick Days

אומרים שסקוט אדמס מבסס את טור הקומיקס שלו על סיפורים אמיתיים שהוא מקבל במייל. הנה מספר סיפורים שיכולים לפרנס עוד כמה טורים – כולם דברים שנאמרו בנוכחותי בשנים האחרונות (בתוספת הרהורים משלי):

  • "אני לא יודע מה זה עוצמה" (הנטייה הראשונית שלי הייתה לצעוק עליו "החוצה!", אבל ישבנו והסברתי לו מה המשמעות של עצמה סטטיסטית).
  • "איך זה שאתה חישבת גודל מדגם X ולמתחרים יש גודל מדגם Y?" (דווקא לזה יש לי תשובה ארוכה, מפורטת ומצויינת).
  • "אם ה-p-value הוא 0.051, למה זה לא מובהק?" (יש לי תשובה גם לשאלה הזו, אבל אף אחד לא יאהב אותה).
  • "לא רצינו לבזבז זמן עד לישיבה ולכן בינתיים התחלנו את הניסוי" (נאמר בפתח ישיבת DOE , כלומר ישיבה בה אמורים לתכנן את הניסוי).
  • "מה זה משנה אם בודקים השערה אחת או שתיים?" (שאלה טובה, שלא לומדים את התשובה עליה בקורס מבוא לסטטיסטיקה).
  • "תכנון ניסוי זו המלצה – יש לנו זכות לשנות אותו כרצוננו" (לסת נשמטת בתדהמה).
  • "אל תעשה לי מודלים על הפרוייקט שלי" (משפט זה נאמר בזעם, תוך כדי דפיקה על השולחן, לאחר שאמרתי בתמימותי כי אני מתכוון לנתח את הנתונים לפי מודל סטטיסטי כלשהו).
  • "בכימיה לא צריך סטטיסטיקה" (ההיפך דווקא נכון – בסטטיסטיקה לא צריך כימיה, לא שיש לנו משהו נגד כימיה).
  • "הנתונים מהייצור בעייתיים, אולי אתה יכול לעשות איתם משהו?" (בקשה שהגיע מאנשי הכימיה).

עד כאן התסכולים שלי, אבל איך הרגישו האנשים שאמרו את הדברים הנ"ל כאשר קראו משפטים כגון:

obscured stat sentences

את כל המשפטים הלא מובנים האלה כתבתי אני בכל מיני דו"חות, ואני בטוח שכל האנשים הטובים (באמת אנשים טובים, אין כאן טיפת ציניות) שאמרו את המשפטים שהבאתי למעלה יכולים לדלות מהזיכרון שלהם כל מיני משפטים תמוהים ומשעשעים (בעיניהם) שאני אמרתי להם.

אז מה קורה כאן בעצם? יש מספר אפשרויות. האם יתכן שהתקשורת אשמה? האם אנו עדים להכשרה סטטיסטית לקויה של ביולוגים/כימאים/מהנדסים? הייתכן כי האשם הוא דווקא בהכשרה לקויה של סטטיסטיקאים לקראת עבודה יישומית בתעשייה?

התשובה לכל שלוש השאלות האלה היא "כן".

מה אפשר לעשות? לדעתי יש להכניס מספר שינויים בתכניות הלימודים הנהוגות היום באוניברסיטאות. אפתח בתובנות שלי בנושא ההכשרה הסטטיסטית ללא סטטיסטיקאים.

תיאור הקורס "חשיבה סטטיסטית בפסיכולוגיה" באוניברסיטה העברית. האם זהו קורס בחשיבה סטטיסטית או רק בחישובים סטטיסטיים?

 

באוניברסיטה העברית יש קורס יחיד שעוסק, על פי כותרתו, בחשיבה סטטיסטית. כפי שהעיר פרופ' צבי גילולה, שנכח בהרצאתי, תרגום כותרת הקורס באנגלית לא ממש מתאימה לכותרת העברית, ואכן, מבט מהיר בתיאור הקורס מעלה את החשד כי מדובר בעוד קורס מבוא לסטטיסטיקה, שבו התלמידים ילמדו לחשב סטיית תקן ולשרטט היסטוגרמה, ואולי אפילו לחשב רווח סמך באמצעות שימוש בהתפלגות t. סביר מאוד להניח שהם ינצרו את הידע הזה במוחם החל מאי שם לקראת סוף הסמסטר ועד פרסום תוצאות המבחן (אי אפשר למחוק הכל מהזיכרון מייד עם סיום המבחן, תמיד יש לקחת בחשבון סכנה של מועד ב').

אני בטוח שכל האנשים בעלי תארי מוסמך ודוקטור שעובדים איתי ידעו גם הם פעם, במהלך חייהם, לחשב סטיית תקן וכדומה (ציון עובר בסטטיסטיקה הוא תנאי הכרחי, אם כי לא מספיק, לקבלת התואר), ולמרות זאת חלקם אינם ניחנים ביכולת חשיבה סטטיסטית. זו לא אשמתם. אף אחד לא מלמד באוניברסיטה את היכולת (הנרכשת) הזו. התמזל מזלי ושהיתי עשר שנים במחיצת טובי הסטטיסטיקאים של האוניברסיטה העברית, והצלחתי ללמוד מהם משהו. אבל מי שלומד במשך סמסטר אחד או שניים מבוא לחישובים סטטיסטיים, וזה הכל, ספק רב אם יסגל לעצמו עקרונות של חשיבה סטטיסטית.

יש לערוך שינוי גישה בהוראת הסטטיסטיקה ללא סטטיסטיקאים. בעידן שבו כל אחד יכול להוריד מהאינטרנט תכנה סטטיסטית חופשית ולערוך כמעט כל חישוב סטטיסטי בלחיצת כפתור, חבל לבזבז את הזמן היקר והמועט העומד לרשותנו כדי ללמד סטודנטים איך לחשב סטיית תקן או רווח סמך. הרבה יותר חשוב להסביר להם מהי המשמעות שלהם. הרבה יותר חשוב לדון בעקרונות סטטיסטיים: דגימה, תכנון ניסויים, רנדומיזציה, עקרונות ההסקה הסטטיסטית. בקיצור – יש להתרכז בחשיבה סטטיסטית ולא בחישובים סטטיסטיים.

גם הכשרת הסטטיסטיקאים צריכה לעבור שינוי מהותי, בייחוד אם תחזיתו של פרופ' גילולה לגבי עתיד הסטטיסטיקה כמדע אכן נכונה. עלינו לזכור כי הסטטיסטיקאי אינו פועל בחלל ריק, וכדי שיוכל לבצע היטב את עבודתו עליו להיות מסוגל לקיים אינטראקציה עם עמיתים מתחומים אחרים, במיוחד אם הסטטיסטיקאי נמצא בסביבה תעשייתית.

הכשרה ראויה צריכה לתת לסטטיסטיקאי יכולת להציג היטב נתונים ומסקנות – קורס בגראפיקה סטטיסטית יכול להיות שימושי. הסטטיסטיקאי זקוק ליכולת העברה ראויה של אינפורמציה ללקוחות, שיוכל לרכוש בקורס בכתיבה טכנית/מקצועית. את יכולת התקשורת העתידית הוא יוכל לשפר אם יזכה ליותר אינטראקציה עם אנשים מדיסציפלינות אחרות, זה המקום להציע לקיים יותר סדנאות לייעוץ סטטיסטי, בשיתוף עם מחלקות אקדמיות אחרות, גם במסגרת לימודי התואר הראשון. גם היפתחות לאופן חשיבה שונה יכולה להועיל, ולכן צריך לשקול את האפשרות לחייב סטודנטים לקחת קורס חובה בתחום חיצוני ("מבוא לביולוגיה ללא-ביולוגים", למשל).

ולבסוף – מה שנכון לגבי כל אחד נכון בודאי גם לסטודנטים לסטטיסטיקה. גם לימודי הסטטיסטיקה צריכים להתמקד בחaיבה הסטטיסטית, ולא בחישובים הסטטיסטיים.

פורסם לראשונה באתר "רשימות" בתאריך 20 במרץ 2007 שם התקבלו 8 תגובות

אסף ברטוב  [אתר]  בתאריך 3/20/2007 2:26:36 PM

ללא כותרת

יפה אמרת. ולדעתי, כך גם במתימטיקה התיכונית: יותר חשיבה מתימטית, פחות חישובים.
תלמידי ישראל לומדים איך למצוא את שורשיה של משוואה ריבועית, אך כמעט לעולם אינם לומדים באילו הזדמנויות תהא יכולת זו שימושית. כך גם לגבי כל חטיבת הטריגונומטריה, שנלמדת בד"כ כמצוות אנשים מלומדה, בלי שמץ של קישור לשאלת השימוש. ועוד ועוד.

דרומי  [אתר]  בתאריך 3/20/2007 3:41:39 PM

דווקא אצלנו…

דווקא אצלנו (סוציולוגיה, בן גוריון), הכיוון בתואר השני היה מאוד דומה למה שאתה מתאר. המרצה לא התעסקה בטכניקות חישוביות, אלא הציגה מודלים סטיסטיים ובדקה איתנו לאיזה סוג מחקרים חברתיים הם מתאימים, ומה מכלול השיקולים.
מצד שני, זה לא עזר הרבה, כי היא הייתה מרצה גרועה שבקושי ידעה עברית.

אסי  [אתר]  בתאריך 3/20/2007 3:53:16 PM

רשימה מעולה

כמאותגר סטטיסטית – בעיקר בגלל הלימודים – התחלתי לאחרונה את הספר המצויין של kirkwood & sterne ולאט לאט אני מתקדם במעלה.
מספרים מפחידים רופאים – או כמו שחמותי נוהגת לאמר בחכמה מרובה – אם היית יודע חשבון היית הולך להיות מהנדס לא רופא.

גיל  [אתר]  בתאריך 3/20/2007 4:02:27 PM

אתה צודק, אבל חלק ניכר מהאשמה

היא על הסטטיסטיקאים. יצא לי לקחת קורסים דומים של רגרסיה וניתוח שונות במחלקה לפסיכולוגיה ובמחלקה לסטטיסטיקה, ולפעמים נדמה היה לי שהקורסים לא עוסקים באותו נושא, כי הם נלמדו בצורה שונה כל כך. דווקא הסטטיסטיקאים עסקו בעיקר במודלים ובהרבה חישובים וכמעט לא התייחסו לבעיות יום יומיות. מאוד היה קשה ליישם את המודלים שלהם אחרי הקורס.
אני מסכים איתך שקורסים בסיסיים צריכים להיות כמה שפחות מתמטיים כי זה יוצר רתיעה אצל הסטודנטים.

איריס ח.  בתאריך 3/20/2007 9:59:49 PM

מסכימה

מנסיון אישי בתור סטודנטית לביולוגיה: למדתי סטטיסטיקה ברמה של בית ספר תיכון (לפחות מה שהבת שלי לומדת בתיכון בחו"ל). והיום אין לי ברירה אלא ללמוד באופן נרחב…
אתה צודק בעיקר מכיוון שהיום אפשר לעשות מבחנים סטטיסטיים דרך האינטרנט. במיוחד כשאפשר לדחוף מספרים לטבלאות מאוניברסיטת ג'ורג'טאון, חשוב להבין אם התוצאה שיצאה והדרך הם הגיוניים.
ובאשר לחברות תרופות: הבעיה שלהם זה לא רק חוסר הבנה סטטיסטית. הם דווקא מבינים מצויין במספרים, אנשי השיווק, כשזה מתאים להם. הרי אם היה יוצא שיש הבדל סיגניפיקנטי בין הטיפול (שלהם) לבין פלצבו או טיפול של המתחרה, הם היו מבינים את זה יופי.

מ.א.   בתאריך 3/20/2007 10:09:18 PM

רשימה משעשעת למדי

דווקא לאחר לימודים של קורסים קצת יותר מתקדמים בסטטיסטיקה, נפל לי האסימון שאחד הדברים החשובים במחקר הוא סטטיסטיקאי.
אבל הקשר עם הסטטיסטיקאי צריך להיות הרבה מעבר להעברת החומר במייל וקבלת פי ווליו.
כדי שהסטטיסטיקה של מחקר תהיה טובה באמת, הסטטיסטיקאי צריך להבין טוב מאוד את שלבי הניסוי והתוצאים השונים והחוקר צריך להבין טוב מאוד סטטיסטיקה.
אחרת שום דבר לא הולך…

עומרון  בתאריך 3/21/2007 6:45:38 PM

דווקא לא

רשימה מעניינת, אבל אני חושב שזו טעות לחשוב שניתן לוותר על יסודות. אתן דוגמא.
ביליתי סמסטר אחד בלימוד תלמידי כיתה ז' לחשב כמה זה 3+2 ו-1+6 וכדומה. זה בגלל שבעידן של מחשבונים, מדוע בכלל ללמוד פעולות חשבון בסיסיות?
בסיס צריך. הבעיה היא שלפעמים הופכים את הנושא לקרדום לחפור בו. אבל מכאן ועד וויתור על ידע ויכולות בסיסיות המרחק רב.

נוה  בתאריך 3/24/2007 12:34:02 PM

שווה לראות את זה. . .

סקירה מעניינת עם דוגמאות למדוע חשוב להבין מתחמטיקה
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=p_donnelly

מגילת אסתר סמואל כהן

הבוקר נפתח בירושלים כנס מדעי הנושא את השם הבלתי שגרתי "מגילת אסתר סמואל כהן".  אם תחפשו את אסתר סמואל כהן בגוגל תקבלו רק 9430 תוצאות, ומתוך 50 התוצאות הראשונות רק כחמישית יהיו רלוונטיות. חיפוש אחרי שמה באנגלית יניב באופן טבעי מעט יותר תוצאות – 611 (כולן רלוונטיות), מספר זעום בהשוואה למליוני הדפים שגוגל מנפק בחיפושים יותר שגרתיים. אבל אל תתנו לנתון הסטטיסטי הזה להטעות אתכם: מדובר כאן באחת הסטטיסטיקאיות הגדולות של דורנו.

אנקדוטה משעשעת: אי שם בתחילת שנות ה-90, לימדתי קורס מבוא לסטטיסטיקה לקבוצה של עובדי מדינה. בפתיחת השיעור הראשון, ביקשתי מהתלמידים לומר לי מה עולה במוחם כאשר אומרים להם "סטטיסטיקה" (מתוך כוונה לרשום את כל האסוציאציות על הלוח כדי להסביר במה יעסוק הקורס). הנוכחים היו מופתעים מהפניה והיו כמה שניות של שקט בכיתה. ואז, אחד התלמידים, אדם בשנות החמישים לחייו שישב במרכז השורה הראשונה, הרים את ידו ואמר: "אסתר סמואל כהן".

esther samuel-cahn

סיפור אישי: בקיץ 1984 השתחררתי מהצבא, והתחלתי ללמוד כלכלה באוניברסיטה העברית. תלמידי שנה א נדרשו אז ללמוד במסלול דו-חוגי, וכברירת מחדל בחרתי בחוג לסטטיסטיקה כחוג השני שלי. המרצה של קורס המבוא לסטטיסטיקה, נכתב בשנתון, היה מישהו בשם "פרופ' א. סמואל כהן". בשיעור הראשון הופיע מרצה ג'ינג'י באולם ההרצאות, הודיע כי במשך הטרימסטר הראשון פרופ' אסתר סמואל כהן נמצאת בשבתון, ולכן בינתיים הוא ימלא את מקומה. הג'ינג'י, ד"ר (היום פרופסור) משה פולק, התגלה כמרצה כריזמטי ואהוב שכבש בסערה את לב כל הסטודנטים. בסוף הטרימסטר אף הייתה התארגנות סטודנטים שפנתה בעצומה אל ראש החוג בבקשה כי ד"ר פולק ימשיך ללמד את הקורס. אולם הבקשה לא נענתה, כמובן, ובתחילת הטרימסטר השני התייצבה בפנינו פרופ' א. סמואל כהן ללמד את המשך הקורס. האכזבה הייתה רבה. התייצבה בפנינו אשה מבוגרת, חובשת שביס, בעל קול גבוה שצרם את אזנינו. בהשוואה לד"ר פולק, היה ברור לנו שמדובר בנפילה.

בהמשך התברר, לי לפחות, כי בהחלט יש להסתכל לא רק בקנקן אלא גם במה שיש בו. פרופ' סמואל כהן הייתה מורה מצויינת, שטיפחה היטב את זרעי האהבה לסטטיסטיקה שנטע בי ד"ר פולק. במבט לאחור, 22 שנים לאחר מכן, אני יודע כי הפכתי לסטטיסטיקאי לא בזכות הבחירה המקרית של החוג לסטטיסטיקה כחוג שני, אלא בזכות המבט המעמיק אל תוך עולם הסטטיסטיקה שפרופ' סמואל כהן אפשרה לי באותו קורס מבוא בשנת הלימודים 1984/5.

צברתי לאחר מכן עוד הרבה "שעות אסתר". למדתי אצלה עוד קורסים רבים, כולל סמינר קריאה מודרכת, ואף זכיתי להיות עוזר הוראה בשני קורסים שהיא לימדה. אני גאה לומר על עצמי שאני אחד מתלמידיה.

הכנס הנפתח היום בירושלים נערך לכבודה של פרופ' אסתר סמואל כהן, כלת פרס ישראל, שפרשה לא מזמן מהוראה באוניברסיטה העברית. ברשימת הדוברים בכנס, שיימשך שלושה ימים, נמצאים החוקרים המובילים בתחומים המדעיים בהם פעלה, החל מהסקה בייסיאנית אמפירית ועד אי שוויון הנביא. גם חבריה ותלמידיה יהיו שם. וגם אני.

פורסם לראשונה באתר "רשימות" בתאריך 18 בדצמבר 2006  שם התקבלו 4 תגובות

איתי אשר  [אתר]  בתאריך 12/19/2006 8:00:44 AM

ומעלתה הגדולה ביותר הצניעות

מאת: תלמיד לשעבר בתיאוריה סטטיסטית
ושכן לבלוק השיכון בירושלים בו היא גרה

טלג  [אתר]  בתאריך 12/20/2006 5:37:41 PM

הכנס היה מאד מרגש

מבלי שהכרתי את פרופסור אסתר, הגעתי לכנס מתוך סקרנות סטטיסטית.
וזכתי להנאה רבה מהאווירה של כבוד וחיבה עצומה – שאנשים העניקו לאסתר.
החוויה בכללולתה הייתה מאד מעניינת ונעימה.
(אפילו שמההרצאות הצלחתי לקלוט רק כמות "מובהקת" של 5% מהחומר…)

יוסי לוי  [אתר]  בתאריך 12/20/2006 11:17:10 PM

טל – הנה עוד סיפור על אסתר – בשבילך

כאשר הייתי בשנה ב, הודיעה אסתר כי כנס האיגוד הישראלי לסטטיסטיקה של אותה שנה יתקיים בירושלים, והציעה כי ביום הכנס היא תבטל את ההרצאה שלה בקורס תיאוריה סטטיסטית, בתנאי שאנו, הסטודנטים, נבוא לכנס.
כאשר הבענו את חששותינו שמא לא נבין כלום, היא ענתה לנו: אל תדאגו, גם אני בדרך כלל מפסיקה להבין את ההרצאה אחרי חמש דקות.
אני השתכנעתי (היום אני יודע שהיא תמיד מבינה הכל עד הסוף…) וכך הגעתי לכנס הראשון שלי. אכן, הכנס היה חוויה בלתי נשכחת.

משהו  בתאריך 4/30/2008 6:04:15 PM

ללא נושא

אסתר סמואל ומשה פולק הם בני דודים

איך אומרים סודוקו בלטינית?

לטקס במטה הכללי הגיעו 36 קצינים משש אוגדות – שישה קצינים מכל אוגדה.יתר על כן, כל אוגדה שלחה לטקס סגן משנה אחד, סגן אחד, וכן סרן, רב-סרן, סגן-אלוף ואלוף-משנה. מנהל הטקס ביקש לסדר את הקצינים ב-6 שורות של ששה קצינים – כך שבכל שורה ובכל עמודה יעמוד קצין אחד מכל אוגדה וקצין אחד מכל דרגה. איך יסדר את הקצינים?

השעשוע של אוילר הפך לכלי שימושי בסטטיסטיקה המודרנית

בבעיה הזאת התחבט ליאונרד אוילר, מתמטיקאי שוויצרי, בשנת 1779. אוילר אמנם התעניין בבעיה כדי לשעשע את עצמו, אך משלא הצליח לפתור אותה החליט לתקוף אותה ביתר רצינות. ארבע שנים לפני מותו הובילה אותו בעיית הקצינים למחקר של יצור מתמטי חדש – הריבוע הלטיני.

מהו ריבוע לטיני? כל מי שיודע מהו סודוקו יודע גם מהו ריבוע לטיני: זהו ריבוע המחולק למשבצות: n שורות ו-n עמודות, כאשר בכל משבצת מופיע אחד המספרים בין 1 ל-n (או אחת מ-n האותיות הראשונות באלפבית הלטיני – ומכאן השם "ריבוע לטיני"). על האותיות להיות מסודרות כך שבכל שורה ובכל עמודה תופיע כל אות בדיוק פעם אחת. כדרכם של מתמטיקאים נבר אוילר בריבועים הלטיניים שהמציא, שיער השערות, גילה תכונות מעניינות, מיין את הריבועים הלטיניים למשפחות שונות, כיד הדמיון הטובה עליו. הוא חש כי בעיית הקצינים אינה ניתנת לפתרון, ואף ניסח השערה כללית לגבי התנאים בהם הבעיה פתירה. הבעיה הכללית נפתרה רק ב-1960, כאשר הוכח כי השערתו של אוילר הייתה מוטעית. הבעיה המקורית אמנם אינה פתירה, אך עבור מספרים אחרים של אוגדות ודרגות, קיימים פתרונות.

השאלה היחידה שבאמת לא עניינה את אוילר היא השאלה היישומית. איזה תועלת עשויה לצמוח מחקר הריבועים הלטיניים? עבור אוילר הדבר לא העלה ולא הוריד. אולם, כפי שקרה לא פעם, יתברר כי לריבועים הלטיניים יש יישומים מעשיים רבים, ושעשועון הסודוקו הוא רק אחד מהם. ריבועים לטיניים שימשו לפיתוח אלגוריתמים לפתרון בעיות של חלוקת משאבים והקצאתם, שצצות כמעט בכל תחום של ייצור, מחשוב, ואפילו בחלוקת עוגה בין ילדים. שימוש נוסף לריבועים לטיניים הוא בתחום ההצפנה. אולם השימוש העיקרי לריבועים לטיניים הוא בסטטיסטיקה.

הכימאי ממבשלת הבירה הניח את היסודות לענף מרכזי בסטטיסטיקה

ויליאם גוסט (Gosset), מחלוצי הסטטיסטיקה, היה כימאי שעבר לפרנסתו במבשלות הבירה של גינס. אחד מתפקידיו היה למצוא דרכים לשיפור כמות ואיכות השעורה שגודלה עבור מפעלי הבירה. גוסט התבקש לבחון חמישה סוגי דשן שהוצעו לשימוש בגידול השעורה. פתרון פשטני לבעיה הוא לבחור חמישה שדות, ובכל שדה לנסות סוג אחר של דשן. ניסוי כזה הוא בעייתי. אם יהיו הבדלים ביבולים השונים, לא יהיה אפשר להסיק בודאות כי ההבדלים נגרמו על ידי הדשנים. בשדות שונים יש תנאי גידול שונים: אדמה, אקלים מזיקים, כל אלה יכולים להשפיע על גידול השעורה. הניסוי חייב להיות מבוקר: כל תנאי הגידול, פרט לסוג הדשן, חייבים להיות זהים במידת האפשר. הפתרון של גוסט היה לבחור שדה ריבועי, ולחלק אותו ל-25 ריבועים קטנים. בכל אחד מחלקי הריבוע נעשה שימוש בדשן אחר, כך שבכל שורה ובכל עמודה נעשה שימוש בכל סוגי הדשן. אם נסמן את סוגי הדשן ב-A, B, C, D, ו-E, השדה של גוסט נראה בערך כך:

כלומר, התכנון של גוסט התבסס על הריבוע הלטיני של אוילר. הפיזור של הדשנים על כל השדה מנעו גם את האפקט האפשרי של המיקום בשדה (במרכז או סמוך לקצה) על גידול השעורה. כל שנותר לעשות הוא להמתין לקציר ולהשוות את היבול שהתקבל מכל אחד מהדשנים. הניסוי של גוסט הוביל מאוחר יותר לפיתוח ענף שלם בסטטיסטיקה – תכנון ניסויים.

 

פורסם לראשונה באתר "רשימות" בתאריך  17 ביוני 2005 שם התקבלה שם התקבלה שם התקבלו9 תגובות

סודוקון  בתאריך 6/18/2005 12:00:01 AM

שאלה ליוסי

האם יש אלגוריתם כללי לפתרון בעיות סודוקו (כלומר, האם הבעיה כריעה)?
אם כן, האם ידוע אלגוריתם יעיל? (פולינומיאלי בזמן ריצה)

אבנר  בתאריך 6/18/2005 8:36:20 AM

התנאי היותר מורכב של ריבוע לטיני

פרט לכך שכל עמודה וכל שורה תכלול כל אחד מהפריטים, ישנם מצבים שבהם נדרש שגם סדר הפריטים ישתנה, כך שאם א הופיע בשורה אחת לפני ובצמוד ל-ב באף אחת מהשורות הבאות לא נחזור על כך (אותו תנאי תקף גם לטורים). בסודוקו של תשע נדמה לי שזה בלתי אפשרי, זה בודאות אפרשרי בריבוע לטיני של שלושה טורים על שלוש שורות. איפשהו בדרך בין 3X3 ל-9X9 הבעייה הופכת לבלתי פתירה.

יוסי  [אתר]  בתאריך 6/18/2005 1:22:21 PM

תשובה לסודוקון

קיים אלגוריתם כללי כמובן.
כיוון שמספר הסידורים של 81 סימנים ב-81 משבצות הוא סופי, הרי שניתן "פשוט" לעבור על כולם, עד שיימצא הפתרון הנכון.
לעומת זאת, מי שניסה לפתור סודוקו "קשה" נוכח בודאי כי לפעמים יש צורך בבדיקת מספר אפשרויות עבור משבצת מסויימת, ולכן המסקנה היא כי בעיית פתרון הסודוקו נמצאת ב-NP, ומכאן שלא ידוע אם קיים אלגוריתם יעיל (פולינומיאלי( לפתרון הבעיה.

יוסי  [אתר]  בתאריך 6/18/2005 1:25:03 PM

תשובה לאבנר

התנאי שציינת יכול להתקיים בכל ריבוע לטיני מסדר זוגי, ואינו יכול להתקיים בריבוע לטיני מסדר אי זוגי.

בתאריך 6/19/2005 12:00:23 AM

ישנה הוכחה מסודרת יותר

ישנה הוכחה מסודרת יותר להיות הבעיה של הסודוקו NP-שלמה (כל הבעיות בP הן בNP זה לא עוזר לי כלום לדעת שהיא בNP השאלה היא אם היא NP שלמה או בP)
אפשר למצוא במאמר מסויים של סינים.

יוסי לוי  [אתר]  בתאריך 6/19/2005 7:40:44 AM

תשובה למגיב הקודם

תודה על ההערה הנכונה

הראל  בתאריך 7/5/2005 12:14:56 PM

לאונדר פולר, ידיהוט אחרונוט

בספרון שהוצאת ידיעות אחרונות הוציאה ונקרא משהו כמו "נפלאות הסודוקו", כתוב בהקדמה שהסודוקו הומצא תחת השם "משבצות לטיניות" על ידי מתמטיקאי שוויצרי משועמם בשם לאונרד פולר.
ידיעות אחרונות כבר קראתם??

הראל  בתאריך 7/5/2005 12:16:11 PM

NP-C

בערך האנגלי על סודוקו בויקיפדיה תמצאו קישור למאמר שמוכיח כי הבעייה היא NP שלמה.

ג. יפית  בתאריך 8/31/2005 11:47:37 AM

גם חבר שלך כותב פה על סודוקו

http://www.notes.co.il/ben-hateva/12445.asp
אבל עם כל הצרה נשגבה ממני הדרך שהוא הרכיב שם את המשחק. די מבולבל מה שהוא עשה שמה.

הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל

"כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה, משום שזהו כלי המדידה של כוונותיו" – פלורנס נייטינגייל

אני מניח שבסביבתכם הקרובה החגיגות לא מורגשות במיוחד, ובכל זאת, היום מצויין ברחבי העולם יום האחים והאחיות הבינלאומי. אל תרוצו לקנות מתנה לאחותכם הגדולה – מדובר כאן בהוקרה בינלאומית למקצוע הסיעוד. התאריך לא נבחר במקרה – ה-12 במאי הוא יום הולדתה של פלורנס נייטינגייל – הידועה בעיקר בזכות התרומה שתרמה להתפתחות מקצוע הסיעוד והפיכתו לדיסציפלינה מודרנית. פחות ידועה תרומתה של נייטינגייל לתחום הסטטיסטיקה. פלורנס נייטינגייל נמנית על חלוצי הסטטיסטיקה המודרנית.

פלורנס נייטינגייל נקראה על שם העיר פירנצה (פלורנס) באיטליה, שם נולדה היום לפני 186 שנה (12 למאי 1820), במהלך טיול באירופה שערכו הוריה. אביה, איש אצולה שלמד בקיימברידג´, נטל על עצמו להיות המורה הפרטי של פלורנס ושל אחותה הבכורה. השיעורים כללו לימוד יצירות קלאסיות, הפילוסופיה של אריסטו ואויקלידס, תנ"ך ופוליטיקה. בהיותה בת עשרים ביקשה מהוריה רשות ללמוד מתמטיקה, אך אמה התנגדה לכך, ואביה הציע כי תלמד תחום המתאים יותר לנשים, לדעתו. לאחר מאבקים הסכימו לבסוף, ונייטינגל החלה ללמוד מתמטיקה בהדרכתו של המתמטיקאי גוז´ף סילבסטר. היא גם עסקה בהוראת מתמטיקה לילדים.

Nightengale

נייטינגל התעניינה גם בנושאים חברתיים, וב-1845 החליטה לעסוק גם בטיפול בחולים כאחות, למרות שלא היה לה כל רקע בנושא. הוריה שוב התנגדו, שכן מקצוע זה לא נחשב למכובד באותם הימים. אך ב-1849 סיירה עם ידידים במצרים, ושם ביקרה במספר בתי חולים. ב-1850 החלה ללמוד בבית ספר לאחיות באלכסנדריה. ב-1853 חזרה ללונדון, והחלה לעבוד בהתנדבות באחד מבתי החולים שבעיר. כעבור שנה, כאשר הכריזה בריטניה מלחמה על רוסיה, התייצבה נייטינגייל יחד עם עוד 38 אחיות בקונסטנטינופול, ולמעשה כפתה על הצבא הבריטי להיעזר בשירותן בבתי חולים צבאיים. היא הנהיגה מספר רפורמות רפורמות בניהול בתי החולים, שהחשובה ביניהן היא שמירה על רמת סניטציה נאותה.

כדי להראות את חשיבות השמירה על רמת הסניטציה, נייטינגייל אספה בקפדנות נתונים סטטיסטיים אודות שיעורי התמותה בבתי החולים השונים.  היא ניצלה את ידיעותיה במתמטיקה כדי להראות כי שיעור התמותה צנח מיידית עקב הנהגת הסניטציה מ-80% ל-47%, ובמשך הזמן הלך וירד עד לשיעור של 2.2% בלבד. "כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה", אמרה נייטינגייל, "משום שזהו כלי המדידה של כוונותיו".

נייטינגייל גם פיתחה שיטות גרפיות להצגת הנתונים. הנה דיאגרמת "קוטב-שטח" (polar area) ששירטטה:

Polar-Area Diagram

הדיאגרמה מזכירה לכם את דיאגרמות העוגה המפורסמות – הלא כן? אולם הדיאגרמה הזו מתוחכמת בהרבה. נייטינגייל משלבת כאן מספר רעיונות. כל גזרה מייצגת קטגוריה של נתונים (בתי חולים במקרה הזה). אורך הגזרה (המרחק מהמרכז) מייצג שכיחות, וכל גזרה מחולקת בנוסף לכך לשלושה חלקים בשלושה צבעים (הדיאגרמה המקורית הייתה צבעונית) המייצגים סיבות תמותה. שטח הגזרות מבטא את השונות של התצפיות. כל זאת בשתי נקודות זמן. מדיאגרמה זו התפתחה בהמשך דיאגרמת העוגה הפשוטה יותר, וגם ההיסטוגרמה – בה השטח מבטא שכיחות.

כאשר חזרה ללונדון עם סיום מלחמת קרים ב-1856, המשיכה לאסוף נתונים על שיעורי התמותה בבתי החולים הצבאיים, כדי לקדם את שיטות הניהול שפיתחה. מאמציה נשאו פרי, ובהוראת המלכה ויקטוריה הוצאו המלצותיה לפועל. ב-1857 הייתה לאשה הראשונה שנבחרה אי פעם לחברה הסטטיסטית המלכותית בזכות תרומתה בתחום הסטטיסטיקה הרפואית. היא הוזמנה לייעץ לממשלות קנדה וארצות הברית בתחומים אלה. כמו כן, פתחה בית ספר לאחיות משל עצמה, בו נלמד מקצוע האח/ות על פי העקרונות והסטנדרטים החדשים שקבעה. כמו כן פרסמה למעלה מ-200 ספרים ומאמרים בנושאי סיעוד וסטטיטיקה רפואית. ב-1874 נבחרה לחברת כבוד באיגוד האמריקני לסטטיסטיקה. כמו כן הוענקו לה שני תארי אצולה, מידי המלכה ויקטוריה ב-1883 ומידי המלך אדוארד השביעי ב-1907. היא נפטרה ב-13 לאוגוסט 1910 בגיל 90.

פורסם לראשונה באתר "רשימות" בתאריך 12 במאי 2006 שם התקבלו 2 תגובות

yoni  בתאריך 5/17/2006 11:56:47 PM

מדהים

לא יאומן כמה רחבי אופקים היו אנשים בעולם ללא תקשורת ואינפומציה חופשית. תודה על המאמר

שרונה  בתאריך 5/6/2008 10:47:12 AM

תודה על האינפורמציה

אני אחות במקצועי ומאד הופתעתי לראות שפלורנס נייטינגל ניחנה בעוד כשרונות כמו סטטיסטיקה וניתוח מספרים. בתור אחות שמקווה לערוך מחקרים בעתיד זה רק מעודד ונותן דוגמא טובה ולכן תודה לך, שרונה