חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

הסטטיסטיקה בתעשייה – לאן?

נהוג לפתוח כל מאמר או הרצאה באנקדוטה משעשעת או באמירה פילוסופית. המאמר הבא, שמבוסס על הרצאה שנתתי בסמינר האיגוד הישראלי לסטטיסטיקה, מתבסס על נסיוני בתעשייה (בעיקר התעשיה הפרמצבטית) בעשר השנים האחרונות, ועל האמירה הבאה, המיוחסת לסופר המדע הבדיוני ה. ג'. וולס:

ה. ג'. וולס (1866-1946) חזה כי בחברה המודרנית יכולת חשיבה סטטיסטית תהיה חיונית באותה מידה כמו יכולות הקריאה והכתיבה

"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write." – H. G. Wells

בכל הנוגע לתעשייה הפרמצבטית, העתיד אותו חזה וולס כבר כאן. הסטטיסטיקה מהווה נדבך מרכזי בכל תהליכי המחקר, הפיתוח, והייצור של התעשיה. איש אינו מעלה על דעתו לצאת לניסוי קליני ללא ליווי סטטיסטי צמוד, ובשנים האחרונות הדרישה לתמיכה סטטיסטית גם בשלבי פיתוח מוקדמים יותר, וגם בתהליכי הייצור גוברת, בד בבד עם עליית המודעות לערך המוסף שמביאה הסטטיסטיקה עמה. כמובן, ככל שמתרחב השימוש בסטטיסטיקה כך גדלה הנחיצות של יכולת חשיבה סטטיסטית מצד השותפים לתהליך. אני חושש שלמרות שהעתיד שניבא וולס כבר כאן, יכולות החשיבה הסטטיסטית עדיין לא מספיקות עבור המציאות החדשה.

לפני זמן מה, בבוקרו של יום א' בשבוע, נערכה במקום עבודתי ישיבה שעסקה בעניינים שברומו של עולם. בתחילת הישיבה דווח כי אחד המשתתפים, רופא במקצועו, לא יוכל להשתתף מכיוון שהינו חולה. מייד הועפו באוויר כל מיני הערות בסגנון "הסנדלר הולך יחף" וכדומה, ואני התבדחתי והערתי כי 40% מימי המחלה מדווחים בימי ראשון או חמישי. ההערה גרפה צחוק רועם, אך מייד לאחר מכן התפתח דיון בנושא ימי המחלה, וממנו התחוור לי כי הבדיחה כלל לא הובנה, והצחוק התעורר מהסיטואציה בה סטטיסטיקאי שולף בביטחון עצמי נתון סטטיסטי מהשרוול. בסופו של דבר מצאתי את עצמי נאלץ להסביר את הבדיחה לקהל, דבר שחיסל כל סיכוי לכך שמישהו יהיה משועשע מהבדיחה, וגרם לי להרהר בהמשך היום על המסר שעובר ממני ללקוחות שלי.

עלי לציין כי הבדיחה אינה בדיחה מקורית שלי, והיא כבר נזכרה בכתביו של סקוט אדמס, יוצר הסאגה המודרנית "דילברט". בקריקטורה המובאת כאן אחד הנוכחים דווקא מבין את החשיבה המגוחכת שמאחורי טרוניית הבוס מחודד השיער, אולם העובדים הותיקים יודעים כי חוש הומור המבוסס על "קומון סנס", שלא לדבר על חשיבה סטטיסטית, אינו נמנה עם התכונות של הבוס.

Dilbert Sick Days

אומרים שסקוט אדמס מבסס את טור הקומיקס שלו על סיפורים אמיתיים שהוא מקבל במייל. הנה מספר סיפורים שיכולים לפרנס עוד כמה טורים – כולם דברים שנאמרו בנוכחותי בשנים האחרונות (בתוספת הרהורים משלי):

  • "אני לא יודע מה זה עוצמה" (הנטייה הראשונית שלי הייתה לצעוק עליו "החוצה!", אבל ישבנו והסברתי לו מה המשמעות של עצמה סטטיסטית).
  • "איך זה שאתה חישבת גודל מדגם X ולמתחרים יש גודל מדגם Y?" (דווקא לזה יש לי תשובה ארוכה, מפורטת ומצויינת).
  • "אם ה-p-value הוא 0.051, למה זה לא מובהק?" (יש לי תשובה גם לשאלה הזו, אבל אף אחד לא יאהב אותה).
  • "לא רצינו לבזבז זמן עד לישיבה ולכן בינתיים התחלנו את הניסוי" (נאמר בפתח ישיבת DOE , כלומר ישיבה בה אמורים לתכנן את הניסוי).
  • "מה זה משנה אם בודקים השערה אחת או שתיים?" (שאלה טובה, שלא לומדים את התשובה עליה בקורס מבוא לסטטיסטיקה).
  • "תכנון ניסוי זו המלצה – יש לנו זכות לשנות אותו כרצוננו" (לסת נשמטת בתדהמה).
  • "אל תעשה לי מודלים על הפרוייקט שלי" (משפט זה נאמר בזעם, תוך כדי דפיקה על השולחן, לאחר שאמרתי בתמימותי כי אני מתכוון לנתח את הנתונים לפי מודל סטטיסטי כלשהו).
  • "בכימיה לא צריך סטטיסטיקה" (ההיפך דווקא נכון – בסטטיסטיקה לא צריך כימיה, לא שיש לנו משהו נגד כימיה).
  • "הנתונים מהייצור בעייתיים, אולי אתה יכול לעשות איתם משהו?" (בקשה שהגיע מאנשי הכימיה).

עד כאן התסכולים שלי, אבל איך הרגישו האנשים שאמרו את הדברים הנ"ל כאשר קראו משפטים כגון:

obscured stat sentences

את כל המשפטים הלא מובנים האלה כתבתי אני בכל מיני דו"חות, ואני בטוח שכל האנשים הטובים (באמת אנשים טובים, אין כאן טיפת ציניות) שאמרו את המשפטים שהבאתי למעלה יכולים לדלות מהזיכרון שלהם כל מיני משפטים תמוהים ומשעשעים (בעיניהם) שאני אמרתי להם.

אז מה קורה כאן בעצם? יש מספר אפשרויות. האם יתכן שהתקשורת אשמה? האם אנו עדים להכשרה סטטיסטית לקויה של ביולוגים/כימאים/מהנדסים? הייתכן כי האשם הוא דווקא בהכשרה לקויה של סטטיסטיקאים לקראת עבודה יישומית בתעשייה?

התשובה לכל שלוש השאלות האלה היא "כן".

מה אפשר לעשות? לדעתי יש להכניס מספר שינויים בתכניות הלימודים הנהוגות היום באוניברסיטאות. אפתח בתובנות שלי בנושא ההכשרה הסטטיסטית ללא סטטיסטיקאים.

תיאור הקורס "חשיבה סטטיסטית בפסיכולוגיה" באוניברסיטה העברית. האם זהו קורס בחשיבה סטטיסטית או רק בחישובים סטטיסטיים?

 

באוניברסיטה העברית יש קורס יחיד שעוסק, על פי כותרתו, בחשיבה סטטיסטית. כפי שהעיר פרופ' צבי גילולה, שנכח בהרצאתי, תרגום כותרת הקורס באנגלית לא ממש מתאימה לכותרת העברית, ואכן, מבט מהיר בתיאור הקורס מעלה את החשד כי מדובר בעוד קורס מבוא לסטטיסטיקה, שבו התלמידים ילמדו לחשב סטיית תקן ולשרטט היסטוגרמה, ואולי אפילו לחשב רווח סמך באמצעות שימוש בהתפלגות t. סביר מאוד להניח שהם ינצרו את הידע הזה במוחם החל מאי שם לקראת סוף הסמסטר ועד פרסום תוצאות המבחן (אי אפשר למחוק הכל מהזיכרון מייד עם סיום המבחן, תמיד יש לקחת בחשבון סכנה של מועד ב').

אני בטוח שכל האנשים בעלי תארי מוסמך ודוקטור שעובדים איתי ידעו גם הם פעם, במהלך חייהם, לחשב סטיית תקן וכדומה (ציון עובר בסטטיסטיקה הוא תנאי הכרחי, אם כי לא מספיק, לקבלת התואר), ולמרות זאת חלקם אינם ניחנים ביכולת חשיבה סטטיסטית. זו לא אשמתם. אף אחד לא מלמד באוניברסיטה את היכולת (הנרכשת) הזו. התמזל מזלי ושהיתי עשר שנים במחיצת טובי הסטטיסטיקאים של האוניברסיטה העברית, והצלחתי ללמוד מהם משהו. אבל מי שלומד במשך סמסטר אחד או שניים מבוא לחישובים סטטיסטיים, וזה הכל, ספק רב אם יסגל לעצמו עקרונות של חשיבה סטטיסטית.

יש לערוך שינוי גישה בהוראת הסטטיסטיקה ללא סטטיסטיקאים. בעידן שבו כל אחד יכול להוריד מהאינטרנט תכנה סטטיסטית חופשית ולערוך כמעט כל חישוב סטטיסטי בלחיצת כפתור, חבל לבזבז את הזמן היקר והמועט העומד לרשותנו כדי ללמד סטודנטים איך לחשב סטיית תקן או רווח סמך. הרבה יותר חשוב להסביר להם מהי המשמעות שלהם. הרבה יותר חשוב לדון בעקרונות סטטיסטיים: דגימה, תכנון ניסויים, רנדומיזציה, עקרונות ההסקה הסטטיסטית. בקיצור – יש להתרכז בחשיבה סטטיסטית ולא בחישובים סטטיסטיים.

גם הכשרת הסטטיסטיקאים צריכה לעבור שינוי מהותי, בייחוד אם תחזיתו של פרופ' גילולה לגבי עתיד הסטטיסטיקה כמדע אכן נכונה. עלינו לזכור כי הסטטיסטיקאי אינו פועל בחלל ריק, וכדי שיוכל לבצע היטב את עבודתו עליו להיות מסוגל לקיים אינטראקציה עם עמיתים מתחומים אחרים, במיוחד אם הסטטיסטיקאי נמצא בסביבה תעשייתית.

הכשרה ראויה צריכה לתת לסטטיסטיקאי יכולת להציג היטב נתונים ומסקנות – קורס בגראפיקה סטטיסטית יכול להיות שימושי. הסטטיסטיקאי זקוק ליכולת העברה ראויה של אינפורמציה ללקוחות, שיוכל לרכוש בקורס בכתיבה טכנית/מקצועית. את יכולת התקשורת העתידית הוא יוכל לשפר אם יזכה ליותר אינטראקציה עם אנשים מדיסציפלינות אחרות, זה המקום להציע לקיים יותר סדנאות לייעוץ סטטיסטי, בשיתוף עם מחלקות אקדמיות אחרות, גם במסגרת לימודי התואר הראשון. גם היפתחות לאופן חשיבה שונה יכולה להועיל, ולכן צריך לשקול את האפשרות לחייב סטודנטים לקחת קורס חובה בתחום חיצוני ("מבוא לביולוגיה ללא-ביולוגים", למשל).

ולבסוף – מה שנכון לגבי כל אחד נכון בודאי גם לסטודנטים לסטטיסטיקה. גם לימודי הסטטיסטיקה צריכים להתמקד בחaיבה הסטטיסטית, ולא בחישובים הסטטיסטיים.

פורסם לראשונה באתר "רשימות" בתאריך 20 במרץ 2007 שם התקבלו 8 תגובות

אסף ברטוב  [אתר]  בתאריך 3/20/2007 2:26:36 PM

ללא כותרת

יפה אמרת. ולדעתי, כך גם במתימטיקה התיכונית: יותר חשיבה מתימטית, פחות חישובים.
תלמידי ישראל לומדים איך למצוא את שורשיה של משוואה ריבועית, אך כמעט לעולם אינם לומדים באילו הזדמנויות תהא יכולת זו שימושית. כך גם לגבי כל חטיבת הטריגונומטריה, שנלמדת בד"כ כמצוות אנשים מלומדה, בלי שמץ של קישור לשאלת השימוש. ועוד ועוד.

דרומי  [אתר]  בתאריך 3/20/2007 3:41:39 PM

דווקא אצלנו…

דווקא אצלנו (סוציולוגיה, בן גוריון), הכיוון בתואר השני היה מאוד דומה למה שאתה מתאר. המרצה לא התעסקה בטכניקות חישוביות, אלא הציגה מודלים סטיסטיים ובדקה איתנו לאיזה סוג מחקרים חברתיים הם מתאימים, ומה מכלול השיקולים.
מצד שני, זה לא עזר הרבה, כי היא הייתה מרצה גרועה שבקושי ידעה עברית.

אסי  [אתר]  בתאריך 3/20/2007 3:53:16 PM

רשימה מעולה

כמאותגר סטטיסטית – בעיקר בגלל הלימודים – התחלתי לאחרונה את הספר המצויין של kirkwood & sterne ולאט לאט אני מתקדם במעלה.
מספרים מפחידים רופאים – או כמו שחמותי נוהגת לאמר בחכמה מרובה – אם היית יודע חשבון היית הולך להיות מהנדס לא רופא.

גיל  [אתר]  בתאריך 3/20/2007 4:02:27 PM

אתה צודק, אבל חלק ניכר מהאשמה

היא על הסטטיסטיקאים. יצא לי לקחת קורסים דומים של רגרסיה וניתוח שונות במחלקה לפסיכולוגיה ובמחלקה לסטטיסטיקה, ולפעמים נדמה היה לי שהקורסים לא עוסקים באותו נושא, כי הם נלמדו בצורה שונה כל כך. דווקא הסטטיסטיקאים עסקו בעיקר במודלים ובהרבה חישובים וכמעט לא התייחסו לבעיות יום יומיות. מאוד היה קשה ליישם את המודלים שלהם אחרי הקורס.
אני מסכים איתך שקורסים בסיסיים צריכים להיות כמה שפחות מתמטיים כי זה יוצר רתיעה אצל הסטודנטים.

איריס ח.  בתאריך 3/20/2007 9:59:49 PM

מסכימה

מנסיון אישי בתור סטודנטית לביולוגיה: למדתי סטטיסטיקה ברמה של בית ספר תיכון (לפחות מה שהבת שלי לומדת בתיכון בחו"ל). והיום אין לי ברירה אלא ללמוד באופן נרחב…
אתה צודק בעיקר מכיוון שהיום אפשר לעשות מבחנים סטטיסטיים דרך האינטרנט. במיוחד כשאפשר לדחוף מספרים לטבלאות מאוניברסיטת ג'ורג'טאון, חשוב להבין אם התוצאה שיצאה והדרך הם הגיוניים.
ובאשר לחברות תרופות: הבעיה שלהם זה לא רק חוסר הבנה סטטיסטית. הם דווקא מבינים מצויין במספרים, אנשי השיווק, כשזה מתאים להם. הרי אם היה יוצא שיש הבדל סיגניפיקנטי בין הטיפול (שלהם) לבין פלצבו או טיפול של המתחרה, הם היו מבינים את זה יופי.

מ.א.   בתאריך 3/20/2007 10:09:18 PM

רשימה משעשעת למדי

דווקא לאחר לימודים של קורסים קצת יותר מתקדמים בסטטיסטיקה, נפל לי האסימון שאחד הדברים החשובים במחקר הוא סטטיסטיקאי.
אבל הקשר עם הסטטיסטיקאי צריך להיות הרבה מעבר להעברת החומר במייל וקבלת פי ווליו.
כדי שהסטטיסטיקה של מחקר תהיה טובה באמת, הסטטיסטיקאי צריך להבין טוב מאוד את שלבי הניסוי והתוצאים השונים והחוקר צריך להבין טוב מאוד סטטיסטיקה.
אחרת שום דבר לא הולך…

עומרון  בתאריך 3/21/2007 6:45:38 PM

דווקא לא

רשימה מעניינת, אבל אני חושב שזו טעות לחשוב שניתן לוותר על יסודות. אתן דוגמא.
ביליתי סמסטר אחד בלימוד תלמידי כיתה ז' לחשב כמה זה 3+2 ו-1+6 וכדומה. זה בגלל שבעידן של מחשבונים, מדוע בכלל ללמוד פעולות חשבון בסיסיות?
בסיס צריך. הבעיה היא שלפעמים הופכים את הנושא לקרדום לחפור בו. אבל מכאן ועד וויתור על ידע ויכולות בסיסיות המרחק רב.

נוה  בתאריך 3/24/2007 12:34:02 PM

שווה לראות את זה. . .

סקירה מעניינת עם דוגמאות למדוע חשוב להבין מתחמטיקה
http://www.ted.com/tedtalks/tedtalksplayer.cfm?key=p_donnelly

תגובה