חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור תגית תאונות דרכים

הזהרו מעצי באובב וממכוניות שחורות

אחד מקוראי שלח לי את הכתבה הבאה שפורסמה ב"ידיעות אחרונות" לפני זמן מה (לחצו על התמונה כדי לראות אותה בגודל מלא). על פי הכתבה, מכוניות שחורות הינן מסוכנות. לפי נתוני חברת "שגריר", נטען שם, "הסיכוי של מכונית שחורה להיות מעורבת בתאונה הוא פי 1.5 משל מכונית לבנה או אדומה". ואכן, מהתבוננות בטבלה נראה כי 2.12% מהמכוניות השחורות היו מעורבות בתאונות, לעומת 1.48% מהמכוניות האדומות ו-1.50% מהמכוניות הלבנות. האם כדאי לזוז הצידה כאשר רואים במראה מכונית שחורה, כמו שמייעץ לנו הכתב? לא בטוח.

 מכוניות שחורות מסוכנות

קודם כל, ההבדלים בין האחוזים המצוינים עבור המכוניות השחורות והאדומות אינם מובהקים סטטיסטית. ההבדל בין המכוניות השחורות למכוניות הלבנות כן מובהק סטטיסטית, וזאת בגלל המספר הגבוה של המכוניות הלבנות (כ-35,000) לעומת המספר הנמוך יחסית של מכוניות שחורות ב"מדגם" (פחות מ-3000). אבל זה באמת לא משנה. ממילא התוצאה הזו אנקדוטלית, ולא בהכרח מייצגת, כפי שאסביר מייד.

מדוע נצפתה התופעה? יכולים להיות מספר הסברים. הסבר אפשרי אחד ניתן בכתבה על ידי מנכ"ל חברת שגריר. קשה יותר להבחין במכוניות כהות על רקע הכביש, הסביר, וכן הצבע האדון מאפיין מכוניות ספורט ונהגים צעירים. במלים מקצועיות, ייתכן ויש כאן משתנים המתווכים בין צבע המכונית והסיכוי שלה להיות מעורבת בתאונה – סוג המכונית ואופי הנהג. אני חייב לשבח את המנכ"ל הנכבד שסיפק את ההסבר המתבקש, ומיתן בכך את פתיחת הכתבה הסוערת.

ברצוני להוסיף שתי הערות. ראשית, כפי שאולי שמתם לב, הכנסתי את המילה מדגם למרכאות כפולות כאשר התייחסתי לנתונים שפורסמו בפיסקה השניה של רשימה זו. זה לא במקרה. הנתונים אינם נתוני מדגם, אלא נתונים המתייחסים לכלי הרכב של מנויי חברת שגריר. ייתכן כי מנויי החברה שונים באופן מהותי מנהגים שאינם מנויים. למשל, ייתכן כי שרוב המנויים מקבלים את המנוי כתוספת לביטוח המקיף של הרכב, ומצד שני רוב הנהגים שאין להם ביטוח מקיף גם אינם מנויים של שגריר. אם כך הדבר, אזי המסקנות הנגזרות מנתוני שגריר אינן תקפות לכלל אוכלוסיית הנהגים ומכוניותיהם.

הערה שניה: כיצד אפשר באמת לוודא האם לצבע הרכב יש או אין השפעה על הסיכוי להיות מעורב בתאונת דרכים? במלים אחרות – כיצד אפשר לנטרל את השפעת המשתנים המתווכים? הדרך לשעות זאת היא בעזרת ניסוי מבוקר. לוקחים קבוצת נהגים, ומקצים להם באופן מקרי מכוניות בצבעים שונים. לאחר תקופת מה, בודקים את שיעור המעורבות בתאונות הדרכים של כל אחת מקבוצות המכוניות. זה לא מעשי כמובן, כשמדובר במכוניות, אבל זו פרקטיקה מקובלת בהרבה תחומים אחרים – פיתוח תרופות למשל.

ולסיום – לא משנה מה צבע המכונית שלכם. סעו בזהירות!

מה הקשר בין איזופודים ותאונות דרכים?

לפני כמה שנים (אוקיי, 15 שנה בערך), כשהייתי דוקטורנט צעיר לסטטיסטיקה באוניברסיטה העברית, השתתפתי במסגרת לימודיי בסדנה לייעוץ סטטיסטי. במסגרת הסדנה הציגו חוקרים מהאוניברסיטה, בדרך כלל דוקטורנטים ממחלקות אחרות, בעיות סטטיסטיות עימן התמודדו במסגרת מחקרם, והסטודנטים שהשתתפו בסדנה ניסו, בסיוע מרצים במחלקה לסטטיסטיקה, לסייע לחוקרים כמיטב יכולתם.

עליי הוטל לסייע לדוקטורנט מהמחלקה לגיאוגרפיה בשם סיימון (אני לא זוכר את שם המשפחה). ידידי סיימון עסק בחקר המדבר. אחד הרעיונות שהעלה היה למדוד את רמת המדבור של קרקע על ידי צפיפות האוכלוסיה של בעל חיים מסויים (איזופוד) בקרקע, שהרי ככל שהקרקע לחה יותר, יחיו בה יותר איזופודים על כל מטר מרובע.

לצורך היישום של מחקרו, הוקצו לחוקר שטחים בנגב ב-14 אתרים שונים, כאשר שטח כל אתר כשטח מגרש כדורגל או שניים. סיימון חילק כל שטח למשבצות בגודל 4 מ"ר כל אחת. אתר טיפוסי הכיל כ-2400 משבצות, 20 משבצות בשורה וכ-120 שורות. ובמשך מספר שנים בילה חלק ניכר בזמנו בנגב, סורק את הקרקע, ועורך רישום מדוייק של אוכלוסיית האיזופודים בכל משבצת ומשבצת. כאשר הגיע אל הסדנה לייעוץ סטטיסטי, היו ברשותו עשרות אלפי רשומות אודות אוכלוסיית האיזופודים, ושאלה אחת – מה עושים עם כל הנתונים האלה.

השתדלתי לעזור לו כמיטב יכולתי, ואני מקווה שהצלחתי לעזור לו בניתוח הנתונים (למיטב ידיעתי הוא קיבל את תואר הדוקטור). אבל את העזרה העיקרית שהיה יכול לקבל מסטטיסטיקאי לא יכולתי להעניק לו. הוא פשוט הגיע מאוחר מדי. לו התייעץ סיימון עם סטטיסטיקאי לפני שהתחיל את מחקרו, מציג לו את מטרות המחקר ואת המתודולוגיה הבסיסית בה הוא עומד להשתמש, אני מניח שלא היה נאלץ לספור את אוכלוסיית האיזופודים בכל משבצת ומשבצת. ניתן היה להכין תכנית דגימה שתאפשר להשיג את כל האינפורמציה הדרושה בהרבה פחות מאמץ.

נזכרתי השבוע בסיפור הזה כאשר קראתי בהארץ/דה-מרקר כתבה בנושא אחר לגמרי. "מה הגורם מספר אחת לתאונות? גם משטרת ישראל לא יודעת" – דיווח תומר הדר ב-13.5.07. הסיבה די פרוזאית: תכנת איסוף הנתונים של משטרת ישראל מאפשרת לציין רק עבירה אחת כסיבה לתאונה. אם נהג שיכור סטה מנתיב הנסיעה וגרם לתאונה, אז הסיבה לתאונה היא סטייה מנתיב עקב נהיגה בשכרות, אבל במאגר הנתונים של המשטרה ניתן לציין כסיבה "סטיה מנתיב" או "נהיגה בשכרות", אך לא את שתי הסיבות יחד. הדר שואל, ובצדק, האם הנתונים שמשטרת ישראל מעבירה ללשכה המרכזית לסטטיסטיקה, ועליהם מתבסס דו"ח הלשכה על תאונות דרכים עם נפגעים, באמת משקפים את העבירות שביצעו הנהגים. לא ברור לי כיצד התייחסו אנשי הלמ"ס לבעייתיות בדיווח הסיבות לתאונות – בהודעה לעיתונות לא נאמר על כך דבר. (מי שמעוניין מוזמן לפנות אליהם ולנסות לברר – הכתב תומר הדר לא טרח לקבל את תגובת הלמ"ס).

מה הקשר בין שני הסיפורים האלה? בשניהם יש איסוף לקוי של נתונים, שנובע מחוסר תכנון מראש של תהליך האיסוף. במקרה של משטרת ישראל יש נסיבות מקלות, כפי שמסביר בכתבה ד"ר משה בקר: "המשטרה מסמנת את העבירה שנראית לה מתאימה ביותר לצורך תביעה משטרתית מבחינת הפרקליטות". מערכת הדיווח והאיסוף אכן ממלאת כנראה את תפקידה במערכת האכיפה והענישה, אך למחקר עמוק יותר, שיוכל אולי לסייע במניעה של תאונות דרכים, לא תצלח המערכת המשטרתית. את המחיר ישלמו הנפגעים בתאונות הבאות. אבל הנסיבות המקלות אינן מהוות תירוץ עבור הלמ"ס: האם לא ניתן היה לדגום חלק מהתאונות, ולחפש בניירת שבארכיון את כל הנתונים הרלוונטיים לתאונה? זה דורש תקציב, כמובן, וכח אדם. האם הייתה בקשה לתקצוב מחקר סטטיסטי מעמיק יותר של תאונות הדרכים? לא ברור, אם כי אני מעריך שמחקר כזה אכן אינו אפשרי מעשית.

המסקנה משני הסיפורים הלא קשורים האלה ברורה: כדי להשיג ביעילות את הנתונים המתאימים כדי לענות על שאלה מחקר (מהו הגורמים לתאונות הדרכים או מהי מידת הלחות בקרקע מדברית), יש צורך לתכנן מראש איזה נתונים צריך לאסוף, וכיצד לאסוף אותם. התייעצות עם סטטיסטיקאי לפני הביצוע חיונית. אם אתם מגיעים לפגישה ראשונה עם הסטטיסטיקאי לאחר שהנתונים נאספו, זה עלול להיות מאוחר מדי. ייתכן שתגלו כי השקעתם משאבים רבים באיסוף נתונים מיותרים, או גרוע מכך – אין ברשותכם נתונים חשובים שכבר אי אפשר לשחזר

פורסם לראשונה באתר "רשימות" בתאריך 25 במאי 2007 שם התקבלו 3 תגובות

התגובות מתפרסמות על דעת ובאחריות כותביהן בלבד.

רחל  בתאריך 5/25/2007 7:51:45 PM

זה מריח לי מוכר מדי…

ואין לי שום נגיעה לסטטיסטיקה אלא סתם שכל ישר ויצירתיות. פשוט הבעיה היא שאלת מחקר כושלת.
איסוף נתונים כושל ואז כבר אין לך מה לעשות בקיצור מה שנקרא בעיברית מדוברת סינדרום וינוגרד.
או בלשון עדות הספרות המדוברת: מעט מדי מאוחר מדי.
כלומר קודם היה צריך לקרוא לך ואז רק לבצע את המחקר האמור.
קודם היה צריך לאסוף את הנתונים הנכונים מזירת התאונה ולדווח עליהם בצורה הנכונה ללשכה המרכזית לסטטיסטיקה ולא רק על נתון חלקי בלבד
כלומר, לשני הגורמים יש כנראה חוזק שונה מבחינה סטטיסטית אבל הוא מכריע כגורם משולב לתאונה.
כלומר נהיגה במהירות מופרזת לבדה כאשר האדם פיכח תספיק לו אולי לבלום בזמן.
נהיגה במהירות בשילוב עם שיכרות תהיה קטלנית!!!
אולי התוכנה לש המשטרה דפוקה ואפשר להכניס רק נתון אחד כגורם לתאונה מי יודע?
בהנת את שטקר?
רחל

גיל  [אתר]  בתאריך 5/26/2007 3:44:52 AM

בכל מקרה, עדיף שיש עודף נתונים

שצריך לסנן ממחסור חמור בנתונים.

טל גלילי  [אתר]  בתאריך 6/6/2007 11:32:56 PM

רשומה מעניינת

תודה יוסי.
אגב,
את אותו קורס שתיארת (אצלנו הוא כונה "סמינר המעבדה לסטטיסטיקה"), לקחתי בשנתי האחרונה לתואר הראשון – וזו הייתה הסדנה שהובילה אותי להמשיך בלימודי הסטטיסטיקה שלי לתואר השני.
טל.

על סדר היום: האוס, תאונות דרכים, ספרים, ראפ

האוס

דבורית שרגל כתבה סקירה מעניינת על סדרות בתי חולים, בעקבות הסדרה האוס המשודרת בערוץ 3 של הכבלים. הסדרה טובה למדי ומעניינת לצפיה. הפרקים בנויים בתבנית קבועה: מישהו או מישהי מרגיש לפתע לא טוב היכנשהו (מסיבה בעבודה, מופע של הילדים בבית הספר, סוכנות הימורים), מתעלף ובדרך כלל חוטף מכה בראש, ומגיע אל בית החולים שם ד"ר האוס וצוותו נדרשים לאבחן את המחלה, ואנו צופים בתהליך האבחון, במשברים הקורים תוך כדי האשפוז, בתגליות מפתיעות אודות החולים, וכמובן בטוויסט שבו פןתר האוס את התעלומה הרפואית, כל זאת בצירוף עלילות משנה כפי שיש בכל סדרת טלוויזיה המכבדת את עצמה.

מה שמשעשע אותי במיוחד הוא פגישת הצוות הראשונית בתחילת כל פרק, שם נזרקות לחלל האוויר כל הדיאגוזות האפשריות למצבו הבלתי מוסבר של החולה השבועי. ותמיד, תמיד, אחת האפשרויות היא מחלת הזאבת. ותמיד, חמש דקות לאחר מכן, מתברר שלא מדובר בזאבת אלא במשהו אחר. נו, מילא. מדובר רק בסדרת טלוויזיה, והתסריטאים לא חייבים להיות ממש מומחים ברפואה. תהיו בריאים.

תאונות דרכים

אני תמיד שמח לקבל מיילים מקוראי. הקורא עודד שאל אותי במייל: "האם יש לך נתונים על הקשר שבין רמת האכיפה (דוחות) לבין תאונות הדרכים?". האמת, אין לי נתונים, אבל תמיד אפשר למצוא משהו בגוגל. באתר הרשות הלאומית לבטיחות בדרכים אפשר למצוא בהחלט כמות רבה של נתונים. גם באתר המשטרה יש נתונים, אך יש צורך ביותר מאמץ כדי למצוא אותם. אתר הלשכה המרכזית לסטטיסטיקה פחות מועיל בעניין הזה.

באתר המשטרה אפשר למצוא הערכה למספר עבירות התנועה של חציית צומת באור אדום. ההערכה כי מדי יום יש כ-16,000 עבירות כאלה, וקרוב ל-6 מליון עבירות בשנה. אך מדי שנה נרשמים רק כ-40,000 דוחות על עבירה זו. אי ציות לרמזור היה הסיבה העיקרית לתאונות ב-2004 (על פי נתוני המשטרה – קישור לקובץ pdf) והיווה 13% מסך כל הסיבות לתאונות (ו-4% מסך הסיבות לתאונות קטלניות).  ב-2004 היו כ-18000 תאונות (מתוכן כ-500 קטלניות) – ולכן אי ציות לרמזור גרם לכ-2300 תאונות, מתוכן כ-20 תאונות קטלניות. שאר העבירות של אי ציות לרמזור (כמעט 6 מליון עבירות) עברו בשלום – ללא תאונה. האם האכיפה עזרה? לא בטוח. הרי אכיפה נעשית בדיעבד – לאחר שהעבירה נעברה.

בואו נסתכל על הנושא באופן אחר. לפי נתוני הרשות הלאומית לבטיחות בדרכים, היו בישראל בשנת 2004 כ-2 מליון כלי רכב, וכ-3 מליון בעלי רשיון נהיגה. לי נראה כי סביר להניח שבממוצע כל נהג עובר כ-3 עבירות תנועה ביום, וזה נותן לנו 9 מליון עבירות תנועה ביום, ויותר מ-3 מיליארד עבירות בשנה. לא הצלחתי לאתר את מספר הדוחות הנרשמים בשנה על ידי המשטרה בגין עבירות תנועה, אבל ברור לחלוטין שהם מהווים רק שבר אחוז ממספר העבירות. וגם אם תוגבר האכיפה ותוכפל רמתה, המצב יהיה אותו מצב. לדעתי, אנו צריכים להודות למזלנו הטוב שמתרחשות רק כ-18000 תאונות דרכים בשנה. ומה כן צריך לעשות? כנראה שצריך שינוי בקונספציה.

ספרים

הרי השלל שאספתי בדוכני שבוע הספר (4 ספרים מאותה הוצאה שקיבלתי במתנה במסגרת קומבינה שיווקית):

  • המדענים הגדולים – מאת מלווין בראג.
  • מצאתי – מאת אביקם גזית. ספר על ההיסטוריה של המתמטיקה שעדיין לא ניתן להשיג בחנויות.
  • הליכת אקראי בוול סטריט – מאת ברטון ג. מלכיאל. תרגום לא מוצלח למונח ההסתברותי random walk. מקווה שהתרגום עצמו מוצלח יותר.
  • כלכלה עירומה – מאת צ'ארלס וילן. הכותב הוא פרופ לכלכלה מאוניברסיטת שיקגו, מה שמחייב לקרוא את הספר בעיון ובזהירות. ברשימת הממליצים על הספר נמצאים פרופ' ברטון מלכיאל, וחתן פרס נובל לכלכלה, פרופ' גארי בקר (גם הוא מאוניברסיטת שיקגו).
  • סיינפלד ופילוסופיה – מאת וויליאם ארוין, כי לא כל ספר שקונים חייב לעסוק במתמטמטיקה או כלכלה. הקישור הוא לסקירה של תרצה הכטר על הספר, שהופיע באתר רשימות לפני כשנה.
ראפ

אני לא חסיד גדול של הסגנון המוסיקלי הזה, אבל הוידאו הזה בכל משעשע – חבורת סטודנטים לפסיכולוגיה מאוניברסיטת אורגון משתמשים במדיום האמנותי הזה כדי להעביר לקהל הרחב את חוויותיהם מהקורס לסטטיסטיקה.

 

פורסם לראשונה באתר "רשימות" בתאריך 17 ביוני 2006 שם התקבלו 4 תגובות

יואב  בתאריך 6/18/2006 11:22:08 AM

זאבת

לא תמיד הזאבת עולה, למעשה היא עלתה רק בפרק ה-11 של העונה הראשונה (http://www.twiztv.com/scripts/house/season1/house-111.htm)

משוטט  בתאריך 6/19/2006 9:43:19 AM

רגע רגע רגע

גם אני מוצא את הסדרה הזו די מוצלחת, יותר מER או כל מיני דרמות בית חולים שאני לא אוהב בגלל ההומור והמימד הMonk-י שקיים בתוכה- תמיד אתה יודע שתפתר הבעיה בסיום הפרק, רק אתה לא בטוח איך. מה שאומר שאפשר להנות גם אם רואים באדיקות פרק אחר פרק, או רק "בקפיצות".
יוסי, גם בקישור שנתת להסבר על הזאבת, כתוב שיש למחלה שלל תסמינים והרפואה לא ממש יודעת את סיבתה, אז זה תמיד נחמד לזרוק אותה בחלל האויר שבחדר ההתייעצות שם ולהשמע חכם (אפילו שברור שהאוס יבין את העיה בסופו של דבר).
רק עכשיו שמתי לב: מונק-י, חי חי.

אנונימוס  בתאריך 6/19/2006 5:04:00 PM

משטרת ישראל נלחמת בסטטיסטיקה

שהיא ע0מה מייצרת.
שימו לב שרוב הדוחות הן על עבירות שבהן ניתן לאסוף קנסות בקלות וביעילות (מהירות למשל).
אולי זה המקור לנתונים???

נדב  בתאריך 7/16/2007 12:29:44 PM

זאבת

בפרק ששודר אתמול התגלה שהאוס הרס ספר על זאבת כדי להחביא בו את הכדורים שלו. לאחר הבעת התמיהה של פורמן, האוס משיב "זה אף פעם לא זאבת".

על סיקור תאונת הרכבת של הבוקר

הבוקר (27 בדצמבר 2005 ), עקב חיידק שהציק לי באופן אישי, הגעתי אל מרפאת קופת החולים הסמוכה למקום מגוריי. בעודי ממתין לתורי להכנס לרופאה, צפיתי בטלוויזיה שעמדה בלובי במהדורת הבוקר של חדשות ערוץ 2, וכך נודע לי על תאונת הרכבת שהייתה בבינימינה.

מי שהקשיב לכתב שדיווח טלפונית ממקום האירוע, הבין פחות או יותר מה קרה: מיניבוס נתקע דווקא על הפסים, המחסום ירד, נהג המיניבוס התעשת והורה לנוסעיו לנטוש את המיניבוס, הרכבת התנגשה במיניבוס הריק, אין נפגעים פרט להלם שפגע בנהג המיניבוס.

מי שצפה במסך – ראה תמונה אחרת לגמרי: קטע מצולם בן פחות מדקה, שנשלף מהארכיון, ושודר בלולאה על רקע הדיווח הטלפוני. בקטע זה ניתן היה לראות נוף צחיח, מפגש של מסילת ברזל עם דרך עפר ללא מחסום, ומבט מתא הנהג של רכבת נוסעת על הנוף שנשקף אל נהג הקטר. כך גם ניתן היה לראות כי בנתיב הרכבת הזאת הייתה רק מסילה אחת, ולא מסילה כפולה, כמו שיש בין תל-אביב לחיפה. הניחוש שלי – מדובר בצילומים מאחת הכתבות שנעשו לאחר תאונות הרכבת הגדולות שהיו הנגב בשנה האחרונה.

על המסר שקלטו הצופים יכלתי ללמוד מתגובת אדם אחר שעמד לידי: "תראה, מה הפלא שיש תאונות כאלה?", אמר לי, "אין מחסום, אין כלום".

פורסם לראשונה באתר "רשימות" בתאריך 27 בדצמבר 2005