חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'ניהול סיכונים'

כמה מחשבות בעקבות תאונת הדרכים הקטלנית בכביש 90

ביום הבחירות לראשויות המקומיות שהתקיים לפני שבוע, בתאריך 30.10.2018, התרחשה תאונת דרכים קשה מאוד בכביש מספר 90, באיזור ים המלח. התנגשות חזיתית בין שני כלי רכב גרמה לעליית אחד מהם באש, ושמונת נוסעיו, זוג הורים וששת ילדיהם נספו. בתאונה טראגית זו היה שילוב נדיר של מספר גורמים שהפכו אותה לקשה במיוחד. האם אפשר היה למנוע את התאונה הזו? איש אינו יודע. הנה דעתי בקשר למספר נושאים הקשורים לתאונה הזו. המשותף לכל הנושאים: אני לא מאמין שייעשה משהו בעניינים אלה.

ההתנגשות

לא ברור (לי לפחות) אם ההתנגשות החזיתית קרתה בגלל שנהג ג'יפ הטויוטה יצא לעקיפה מסוכנת בכביש לא פנוי או סטה ממסלולו. וכך נגרמה ההתנגשות החזיתית. למרבה הצער זה לא משנה.

עם זאת, יש לדון כאן בשתי שאלות. שאלה אחת היא האם ניתן היה למנוע את הסטייה או העקיפה. השאלה השנייה היא האם ניתן היה למנוע את ההתנגשות – בהנחה שהיא נגרמה כתוצאה מסטייה לא רצונית מהנתיב. לשתי השאלות יש תשובה אחת.

אורלי וגיא העלו את הנושא הזו בתכניתם בערוץ 10/14. יש תשובה פשוטה לשאלות האלה: אילו הייתה גדר הפרדה בין הנתיבים, ההתנגשות החזיתית לא הייתה יכולה להתרחש. אבל הדברים יותר מסובכים: מדובר בכביש חד מסלולי ודו נתיבי. גדר הפרדה בין הנתיבים תגרום לכך שלא תהיה שום אפשרות עקיפה בכביש המופרד, וגם אם נהג סוטה מנתיבו בשוגג, עדיין הגדר תמנע התנגשות חזיתית. אבל, מה עושים אם רכב נתקע, נניח אוטובוס או משאית? או אם רחמנא לצלן נתקעים מאחורי רכב שנוסע במהירות המותרת או אף פחות מכך?

פתרון אפשרי הוא להציע לסלול כביש דו מסלולי עם ארבעה נתיבים, שניים לכל כיוון. העלות של הסבת חלקו הדרומי (מאיזור ים המלח ועד יטבתה) של כביש 90 לכביש כזה נאמדת במיליארדים. נפח התנועה בכביש ככל הנראה אינו מצדיק השקעה כזו, ובאשר לחיים שיינצלו: יכול להיות שאם הכסף הזה יושקע במקום אחר יינצלו חיים רבים יותר.

יש פתרון שלישי: להרחיב את הכביש לכביש חד מסלולי עם 3 נתיבים, ולהקים גדר הפרדה כך שהנתיב השלישי ישרת לעיתים את התנועה דרומה ולעיתים את התנועה צפונה, על ידי הסטה של גדר ההפרדה מידי כמה קילומטרים.

פתרון נוסף הוא לבנות גדר הפרדה במקומות מועדים לפורענות: קטעים עם שדה ראיה מוגבל, פיתולים וכדומה. אפשר להגדיל ולעשות ולבנות גדר הפרדה לאורך רוב הכביש, עם השארת קטעים ללא הפרדה בהם אפשר לבצע עקיפות בטוחות.

המהירות

לא הצלחתי למצוא בשלל הכתבות שהתפרסמו התייחסות למהירות שבה נסעו שני כלי הרכב. המהירות המותרת בכביש בו אירעה התאונה היא 90 קמ"ש. על סמן היכרותי עם תרבות הנהיגה בארץ, אני חושב שהסיכוי כי שני הנהגים לא עברו את המהירות המותרת הוא נמוך. מצד שני, גם  כאשר נוהגים במהירות המותרת, התנגשות חזיתית בין שני כלי רכב מובילה לתוצאות קשות. בכל מקרה, אתייחס כאן לנושא המהירות ללא כל קשר לתאונה עצמה.

יש מי שיטענו שמהירות עצמה אינה הורגת. פורמלית זה כנראה נכון. מטוסי נוסעים חוצים את האוקיינוס האטלנטי במהירות של 900 קמ"ש ולנוסעים לא קורה כלום.

אבל, אני לא חושב שיקום פה מישהו שיטען כי להתנגשות של שני כלי רכב הנוסעים במהירות 20 קמ"ש תהיה אותה תוצאה כמו במקרה של התנגשות בין שני כלי רכב הנוסעים במהירות 90 קמ"ש. אם מתרחשת תאונה, למהירות הרכב יש תפקיד גדול מאוד בקביעת הנזק הנגרם כאשר ג'יפ טויוטה מתנגש ברכב אחר, או בעץ או בקיר בטון.

גורם נוסף שצריך לקחת בחשבון הוא זמן התגובה. מקובל כי הזמן שעובר מהרגע שבו נהג מבחין במשהו שמצריך את תגובתו ועד לביצוע התגובה הוא שתי שניות. רכב שנוסע במהירות 90 קמ"ש עובר 25 מטר בשניה, או 50 מטר בשתי שניות. יש לזה השלכות. למשל, אם נוסעים במהירות הזאת מאחורי רכב אחר, צריך לשמור ממנו מרחק של כ-50 מטר. זה לא קורה בכבישים שלנו. הנהג צריך גם להיות מסוגל להבחין בעצמים בעייתיים בכביש שמצריכים את תגובתו: הולכי רגל[1], אופניים, רכב שעומד בשוליים, רכב שסוטה ממסלולו מסיבה כלשהי ונכנס למסלול התנגשות מולך, או רכב שעוקף אותו וחותך במהירות ימינה כדי להימנע מהתנגשות ברכב שבא ממול. ככל שהדברים האלה מתרחשים במהירות גבוהה יותר פוטנציאל הנזק גבוה יותר.

המסקנה ההגיונית היא לכן להקטין את המהירות, אבל ההיגיון הזה מוביל למסקנה הנכונה אבל בלתי קבילה שאין לנסוע כלל – או, במילים אחרות, לקבוע את המהירות המותרת ל-0 קמ"ש.

המהירות המותרת היא לכן פשרה: איזה מחיר אנחנו מוכנים לשלם תמורת האפשרות לנוע במכוניות. בשטחים עירוניים יש יותר הולכי רגל, יותר ילדים, יותר אופניים, ולכן שם אנחנו מגבילים את המהירות המותרת ל-50 קמ"ש. זה לא מונע לגמרי תאונות, פצועים והרוגים, אבל מישהו כאן חושב שצריך להעלות את המהירות המותרת בעיר ל-90 קמ"ש?

המשוואה בכביש 90 דומה: למהירות מותרת של 90 קמ"ש בכביש חד מסלולי, דו סטרי ודו נתיבי ללא גדר הפרדה יש מחיר מסויים, שמתבטא בחיי אדם, בפצועים ובסתם נזק לרכוש. אם המחיר גבוה מדי, צריך לעשות משהו, שכרוך במחיר אחר. אבל מי בעד הורדת המהירות המותרת? ומי חושב שאם יורידו את המהירות המותרת זה יעזור?

וכאן אני מגיע לנושא כואב במיוחד: אכיפת חוקי התנועה בכלל ואכיפת המהירות המותרת בפרט.

הארץ סוערת מזה מספר חודשים עקב קביעת בית המשפט השלום בעכו כי מצלמות המהירות החדשות שהוצבו ברחבי הארץ אינן אמינות. אין לי נתונים ולכן לא אכנס כאן לדיון בנושא. אומר רק שההתרשמות שלי היא כי הציבור הרחב די מרוצה מהחלטת בית המשפט שגרמה, באופן זמני לפחות, להפסקה בפועל של אכיפת המהירות המותרת בכבישים ברחבי הארץ. אני לא שותף לשמחה הזו, כי כפי שציינתי למעלה למהירות יש מחיר, ואני חושב שלעיתים לא מעטות המחיר הזה גבוה מדי.

בואו נתבונן במקרה חריג במיוחד: כביש 6. המהירות המותרת בכביש זה גבוהה במיוחד, ומגיע בקטעים מסויימים ל-120 קמ"ש. אני לא חושב שיהיה מי שיחלוק על כך שבפועל כלי רכב רבים נוסעים בכביש הזה במהירות הגבוהה באופן משמעותי מהמהירות המותרת. אם אתם חושבים שזה בסדר תעברו הלאה, אבל רק אחרי שתענו על השאלה הבאה: כמה זה "בסדר"? לנסוע במהירות 10 קמ"ש מעל המהירות המותרת זה בסדר? 20? 30? כמה שרוצים?

אם אתם חושבים שיש רמת מהירות שהינה בלתי נסבלת אפילו בכביש 6, נניח 140 קמ"ש לצורך הדיון, הנה הצעה. בכביש 6 יש שערי אגרה, ובכל פעם שמכונית עוברת תחת שער אגרה המכונית מצולמת, ונרשמים מספר הרישוי של המכונית והשעה שבה היא עברה בשער. נניח שיש לנו שני שערים כאלה שהמרחק ביניהם הוא 20 ק"מ. מכונית שנוסעת במהירות המותרת, 120 קמ"ש, תעבור את המרחק הזה ב-10 דקות. מכונית שעברה את המרחק בשמונה דקות נסעה בין השערים במהירות ממוצעת של 150 קמ"ש, 30 קמ"ש מעל המהירות המותרת. בינגו. מה שצריך לעשות עכשיו זה לשלוף את פרטי בעלי הרכב לפי מספר הרישוי, ולזמן אותו לבית המשפט.

כשהעליתי את ההצעה הזו בטוויטר לפני זמן לא רב, נתקלתי בהתנגדות גורפת. נאמרו דברים על "חוסר הגינות" והובעה התנגדות ל-"אכיפה אוטומטית". אני עדיין לא מבין למה זה לא בסדר.

הנה הצעה דומה לגבי כביש 90: אפשר להציב לאורך הכביש מצלמות דומות במרחקים סבירים, קילומטר או שניים או עשרה, ולתעד באופן דומה את המהירות הממוצעת של כלי רכב לאורך הכביש לצורך אכיפה. לדעתי זה עדיף על מצלמה בודדת שמודדת מהירות רגעית. יש הבדל משמעותי בין נהג שברגע של חוסר תשומת לב עבר על המהירות המותרת אך התעשת ותיקן את טעותו ובין נהג שנסע באופן קונסיסטנטי במהירות ממוצעת גבוהה לאורך קטע דרך ארוך יחסית  אתם בעד או נגד? החבר'ה בטוויטר התנגדו.

חגורות בטיחות

למרות שכל הכתבות על התאונה של יום הבחירות ציינו במפורש כי אחד מכלי הרכב המעורבים היה ג'יפ טויוטה, רכב גדול וכבד, באף כלי תקשורת רשמי לא נאמר מאיזה סוג היה כלי הרכב השני. אם תפשו את הכתבות תמצאו ביטויים כגון "טנדר", ו-"רכב מסחרי". בשתי כתבות נאמר בפירוש כי כל שמונת הנוסעים שנהרגו היו חגורים בחגורות בטיחות. בחדשות ערוץ 10 נאמר פעם אחת כי זה היה רכב מסוג סיטרואן ברלינגו, אך אין לי תיעוד של הדיווח הזה. אתם יכולים להאמין לי שכך שמעתי או לא להאמין. בפורום רוטר ובאחד מאתרי המכוניות נאמר כי זה היה רכב מסוג רנו לוגאן, מיניואן לא יקר שייבואו לארץ הופסק לפני כמה שנים. בסיטרואן ברלינגו יש 5 מושבים, ואפילו ברנו לוגאן יש רק 7 שבעה מושבים. לפחות נוסע אחד לא היה חגור בחגורת בטיחות.

יומיים לאחר התאונה הייתי בתורנות נשק חבק וסע בבית הספר של ילדיי. היה עלי לעמוד על המדרכה בכניסה לבית הספר, ולסייע לילדים שהוריהם הסיעו אותם לבית הספר לרדת במהירות רבה יותר מהרכב, ובכך להקל מעט על עומס התנועה ברחוב שבו שוכן בית הספר. נדהמתי לראות כמה ילדים נסעו לא חגורים, ולא פחות ממספר הילדים שישבו במושב הקדמי למרות שגילם ומימדיהם הגופניים לא התאימו לישיבה במושב הקדמי.

אין לי הרבה מה לומר בנושא. זה עוד סימפטום לתרבות עיגול הפינות שלנו ותחושת ה-"לי זה לא יקרה" המפורסמת.

עם זאת אעיר שתי הערות: אמנם החלטה לא לחגור חגורת בטיחות לא פוגעת באופן ישיר באנשים אחרים – זו לכאורה בעיה רק של מי שלא חגר. אבל האם יש קשר בין הנטייה לזלזל בחוק אחד לנטייה לזלזל בחוק אחר? אולי האנשים שלא חוגרים את עצמם ו/או את ילדיהם בחגורת בטיחות גם נוטים יותר לא לתת זכות קדימה להולכי רגל, לדבר בטלפון הסלולרי בזמן הנהיגה ולגנוב רמזורים אדומים? התחושה שלי היא שכן. זה משהו שכדאי וצריך לבדוק.

ועוד משהו: אני לא מקבל את הטענה שזו זכותו של הורה לקבל החלטת בקשר לילד שלו ולכן אם הוא לא רוצה לחגור את הילד בחגורת בטיחות או כיסא בטיחות זו זכותו. הורה כזה מסכן את חייו של הילד, ודינו כדין הורה מתעלל.

קנאביס

לפי מספר דיווחים, נהג הג'יפ שהיה מעורב בתאונת הדרכים של יום הבחירות נהג תחת השפעת קנאביס אותו צרך מספר שעות לפני הנסיעה. בשלב מסויים נטען כי זה היה קנאביס רפואי, ואילו בחדשות ערוץ 10 דווח כי לנהג לא היה רישיון לקנאביס רפואי. צייצתי על כך ציוץ קצת דמגוגי, אני מודה, בטוויטר, וכמובן שמייד קפצו כמה מגיבים ונתנו לי על הראש. בין היתר נשאלתי: "נתקלת במישהו רציני שאמר שסבבה לנהוג תחת השבעת קנאביס?". נכון, לא נתקלתי, ויש לזה סיבה טובה: הנהיגה תחת השפעת קנאביס מסוכנת.

בואו ניפרד מהתאונה ונדון בנושא במנותק.

קנאביס הוא כמו דינמיט וכמו אלכוהול. כשהוודקה נמצאת בתוך בקבוק על המדף בחנות היא לא מסוכנת, גם לא הדינמיט הארוז היטב ושמור בבונקר. הסיכון נובע מהשימוש ומהנסיבות.

אם מישהו חושב שלנהוג בכביש 90 תחת השפעת קנאביס זה לא מסוכן, באמת אין לי מה לומר לו. אבל על סמך התגובה שציטטתי למעלה אני מניח שרובכם יסכימו איתי שזה כן מסוכן.[2]  ואם כן, מה שצריך לעשות זה לנהל את הסיכונים.[3]

יש מספר גישות בעניין.

הגישה הראשונה היא הגישה של "מלחמה בסמים": איסור גורף המלווה בענישה פלילית.

גישה שניה טוענת שיש להחיל לגליזציה גורפת של שימוש בקנאביס ואולי אף בסמים אחרים. אם יש סיכונים, זכותו של המשתמש לקחת על עצמו את הסיכונים האלה. ואם הסיכונים עלולים לגרום לנזק לסביבה ולא רק למשתמש עצמו, אפשר לטפל בזה בשלל אמצעים. למשל: חוק שיאסור נהיגה תחת השפעת קנאביס, ומי שיעבור על החוק הזה יקבל עונש.

הגישה השלישית היא גישת עצימת העיניים: זה לא חוקי, אבל נתעלם. הגישה הזו מיושמת בהולנד[4] ובמידה מסויימת גם בישראל.

לגישה הזו יש הרחבה: נגיד שזה לא בסדר, אבל לא נעשה שום דבר משמעותי בעניין. ראו את הצעת החוק הפופוליסטית שהגישה ח"כ תמר זנדברג שהתגבשה בינתיים להצעת חוק ממשלתית שתחול כהוראת שעה למשך שלוש שנים.

על הגישה הרביעית אני רוצה לדבר בפירוט: גישת ה-"אי הפללה" על פי המודל הפורטוגלי. השימוש בקנאביס (ובסמים אחרים) אסור על פי חוק, אך העוברים על החוק לא מטופלים באמצעים פליליים אלא באמצעים חברתיים/רפואיים, והסנקציות הננקטות כלפיהם הן סנקציות אזרחיות. החלוצה של גישת אי ההפללה הייתה כמובן פורטוגל, ולפני כשנה  נורבגיה הלכה בעקבותיה. בפורטוגל, משתמשים בסמים מופנים לתכניות המתאימות למצבם. נרקומנים מקבלים את הסם לו הם זקוקים, וכך הם לפחות מוצאים ממעגלי הפשיעה ונמנעת התפשטות מחלות מסויימות. משתמשים "קטנים" מופיעים בפני ועדה שחברים בה עובד סוציאלי, פסיכיאטר ועורך דין. הועדה מוסמכת לנקוט סנקציות, שיכולות להיות קנסות, שלילת רישיון הנהיגה, איסור לעסוק במקצועות מסויימים, ועוד.

לפני כחמש שנים כתבתי פוסט ארוך שזכה להרבה תגובות נזעמות. בפוסט ההוא סקרתי שישה טיעונים מרכזיים של תומכי הלגליזציה, ועניתי לכל אחד מהם באופן מפורט.

אני עדיין עומד מאחורי חמישה מתוך ששת הטיעונים שלי. הטיעון שממנו נסוגותי הוא "טיעון פורטוגל". אמרתי כי לדעתי יש צורך להמתין לנתונים נוספים לפני שמאמצים את המודל הפורטוגלי. בפוסט שכתבתי לפני כשנה אודות המעבר של נורבגיה למודל הפורטוגלי כתבתי כי אני נוטה כעת לתמוך במודל הזה. האם ישראל תאמץ את המודל הזה? אני בספק. זה דורש הודאה בקיומה של בעיה ורצון אמיתי להתמודד איתה. אלה דברים שלא מקובלים בישראל.


הערות
  1. פחות סביר בכביש 90, אני מודה []
  2. יש עוד סיכונים בקנאביס אבל נניח להם כרגע []
  3. אל תגידו לי שקנאביס פחות מסוכן מאלכוהול, כי זה לא רלוונטי. אלכוהול הוא לא קו פרשת המים. לא כל מה שפחות מסוכן מאלכוהול אינו מסוכן. יש הרבה מאוד דברים שפחות מסוכנים מאלכוהול והם בכל זאת מסוכנים []
  4. אם כי נעשתה שם בשנים האחרונות נסיגה מסויימת במדיניות הזו []

ממוגרפיה – סיכונים ונתונים

באחת מקבוצות הפייסבוק שאני חבר בהן הופיע ביום שני האחרון (17.9.2018) צילום המסך של הודעה שבה נאמר: "מידע סופר חשוב שעשוי להציל את חייך…הסכנות בבדיקת הממוגרפיה". הפוסט הנ"ל כלל גם קישור לכתבה באתר שעוסק בבריאות הוליסטית או משהו כזה – מייד אמסור פרטים נוספים על הכתבה הזאת.

הגברת ששיתפה את צילום המסך כתבה: "ממוגרפיה – בחירה מושכלת… פשוט אין לתאר".

התגובות לא איחרו לבוא. הנה כמה ציטוטים:

  • לפחות הפעם זה לא יפגע בילדים של הנשים
  • מי שעומדת ברף קוגניטיבי מינימלי (כלומר – בלא מוגבלות שכלית או נפשית), ומחליטה לא לעבור ממוגרפיה בגלל הקשקוש הזה – וואלה זכותה. האהבלה תצטרך לשאת בתוצאות של החלטותיה כמו אדם מבוגר.
  • אבל זה מהאתר הסופר אמין Healthy-Holistic-Living. אפילו יש לו את המילה Health בשם!
  • הכתבה באנגלית? זהו, כבר שוכנעתי.
  • אה, יופי. עכשיו הם גם בעד סרטן השד?

התגובה שלי הייתה מעט שונה:

לא קראתי את כל התגובות, אבל התגובה שלי תהיה ככל הנראה לא פופולרית: לממוגרפיה יש שיעור false positive גבוה, בייחוד בגילאים צעירים. זה מוביל לנזקים של טיפולים רפואיים מיותרים, כולל כריתות וכימותרפיות מיותרות, שלא לדבר על הנזק הנפשי. לכן ההמלצה של גופי הרפואה בארה"ב (לא זוכר בדיוק איזה) היא לערוך ממוגרפיה רק החל מגיל 50, וגם אז רק אחת לשנתיים.

הדיעות נחלקו.  אשה שלא ברור לי מה גילה, אחות במקצועה, כתבה: "אחרי שלאמא שלי היה סרטן השד אני אשאר עם מעקב פעם בשנה". הערתי כי זה מה שקורה בקבוצה המושכלת: הרגשות גוברים על הנתונים. תשובתה: "הנתונים הם עדיין שגילוי מוקדם מציל חיים. באמת, שנגיד לכל אותן בנות 30-40 שגילו אצלם סרטן שיחכו לגיל 50?"

בשלב זה הצעתי הפניה למקורות. המלצתי על ספרו של הפסיכולוג והסטטיסטיקאי הגרמני גרד גיגרנצר, Calculated Risks, שעוסק באופן שבו אנשים מעריכים סיכונים, ונושא בדיקות הממוגרפיה לגילוי מוקדם של סרטן השד נידון בו בהרחבה, יחד עם דוגמאות נוספות[1]. בספר יש הפניות למחקרים רבים בנושאים האלה. המלצתי גם על ספרו של דויד שפיגלהאלטר, The Norm Chronicles,  שפונה יותר לקהל הרחב. אני אדלג על המשך הדיון שהיה בהחלט מרתק.

מה פיספסנו פה?

אני מסכים שאתר ששמו www.healthy-holistic-living.com מעורר תגובה אנטגוניסטית. גם אצלי. אבל שלושה ימים לאחר ההודעה הראשונה בפייסבוק, פתחתי את הלינק וקראתי את הכתבה. אני חושש שאף אחד לא טרח מלבדי לפתוח את הלינק ולקרוא את הכתבה שהציתה את כל הדיון. שאלתי בפירוש מי פתח את הלינק וקרא את הכתבה. אף לא אדם אחד[2] הצהיר כי הוא קרא את הכתבה, וזאת אחרי שכתבתי בפירוש כי לדעתי יש ממש בדברים.  במבט ראשון, מה שראיתי לא מבשר טובות. היו שם כל מיני טענות עם לינקים שהובילו לדפים אחרים באתר הזה. היו שם סימונים של מראי מקום למחקרים שצוטטו (כמו: (1) למשל), אבל הם לא הכילו קישורים. בקיצור: הפניות למחקרים לא היו שם. זה נשמע לי הגיוני. ייתכן מאוד שלא בכל כתבה באתר הזה מסתמכים על מחקרים חיצוניים, ואם יש כתבה ללא הפניות כאלה היא תעורר חשד אם בכתבות אחרות יש הפניות.

מצד שני, על סמך הידע המוקדם שלי, טענתי בקבוצה כי אכן יש ממש בטענות שהועלו, לממוגרפיה יש שיעור גבוה של תוצאות חיוביות שגויות, וייתכן מאוד כי הסיכונים בבדיקה עולים על התועלת שלה. לכן המשכתי לקרוא בעיון.

אפשר לזהות אם יש מקורות או אין. מה שצריך לעשות זה לערוך חיפוש בגוגל על משפטי מפתח מהכתבה. אם הם ציטטו מחקרים, סביר להניח שהציטוט הועתק כלשונו מהמאמר בו פורסם המחקר.

החיפוש הראשון היה אחרי המחקר קנדי שהוזכר שם. איזה מחקר קנדי? חיפוש בגוגל אחרי הביטוי Canadian study breast cancer הוביל אל כתב העת British Medical Journal, אחד מארבעת כתבי העת המובילים בעולם בתחום הרפואה. המחקר שכותרתו " Twenty five year follow-up for breast cancer incidence and mortality of the Canadian National Breast Screening Study: randomised screening trial" עקב במשך 25 שנה אחרי כ-89000 נשים בגילאי 40 עד 59 (בתחילת המעקב), שחלקן עברו ממוגרפיה וחלקן לא[3] . המסקנה:

"Annual mammography in women aged 40-59 does not reduce mortality from breast cancer beyond that of physical examination or usual care when adjuvant therapy for breast cancer is freely available"

יחס הסיכון (Hazard Ratio) הוא 0.99, עם רווח סמך של 0.88-1.12. יחס סיכון קטן מ-1 פירושו כי בפועל נצפו יותר מקרי מוות מסרטן השד אצל נשים שעברו ממוגרפיה, אבל זה רעש סטטיסטי.  ובמילים פשוטות בעברית: אם יש טיפול זמין לסרטן השד, ונעשות בדיקות פיזיות רגילות לגילוי גושים חשודים בשד, לממוגרפיה אין ערך מוסף להורדת התמותה מסרטן השד. בצורה יותר בוטה: לפי המחקר הזה, הממוגרפיות לא מצילות חיים.

משפט מפתח שני אותו חיפשתי הוא:

"If we assume that screening reduces breast cancer mortality by 15% after 13 years of follow-up and that overdiagnosis and overtreatment is at 30%, it means that for every 2000 women invited for screening throughout 10 years, one will avoid dying of breast cancer and 10 healthy women, who would not have been diagnosed if there had not been screening, will be treated unnecessarily. Furthermore, more than 200 women will experience important psychological distress including anxiety and uncertainty for years because of false positive findings."

מה המשפט הזה אומר? אפילו אם מניחים כי ממוגרפיה שנעשית אחת לשנה במשך 13 שנה מקטינה את התמותה מסרטן השד ב-15%[4], ואף מניחים כי אבחון היתר וטיפול היתר[5] הם ברמה של 30%[6], אזי אם 2000 נשים יעברו ממוגרפיה שנתית במשך 10 שנים, יינצלו חייה של אישה אחת. המחיר? 10 נשים יקבלו טיפול בלתי נחוץ לסרטן השד – כי הן לא חולות בסרטן השד – הן אבחנות חיוביות שליליות. איזה טיפולים? לא נאמר, אבל אפשר להעלות ספקולציות: ביופסיה, כריתה, כימותרפיה, הקרנות.

וזה לא הכל: עוד 200 נשים יחוו לחץ פסיכולוגי משמעותי כולל חרדה וחוסר וודאות במשך שנים רבות, וזאת בשל אבחנה חיובית שלילית. מדובר על נשים שקיבלו אבחנה חיובית שלילית, אך בבדיקה נוספת התבררה הטעות. למי שטוען כי לכאורה הכל בסדר אם הטעות התגלתה – המחקר הזה אומר: לא. לטעות יש נזק גם אם נמנע טיפול מיותר לסרטן.

מאיפה בא הציטוט הזה? לא מאתר פרסום ל-"טיפולים הוליסטיים וטבעיים". אלא מסקירה שיטתית של מחקרים שבוצעה במכון קוקריין שפורסמה ב-2013: Screening for breast cancer with mammography.

החיפוש אחר הציטוט האחרון הוביל אותי גם למאמר שהתפרסם בכתב העת New England Journal of Medicine, בשנת 2015, שכותרתו: "Benefits and harms of mammography screening". כבר מהכותרת אתם יכולים ללמוד שיש גם harm: בבדיקות הממוגרפיה יש לא רק תועלת, אלא גם נזק. המאמר סוקר מחקרים שנעשו להערכת שיעור הטעויות החיוביות שליליות של ממוגרפיות, שיעור הטיפולים המיותרים שנערכים עקב טעויות חיוביות שגויות[7], וגם של שיעור הטעויות השליליות השגויות (כלומר: לא אובחן סרטן, למרות שיש). המסקנה של החוקרים חד משמעית: הנזק של בדיקות הממוגרפיה גדול בהרבה מהתועלת. אם אלף נשים מתחילות לעבור ממוגרפיה דו שנתית החל בגיל 50, ימנעו שני מקרי מוות כתוצאה מסרטן השד. המחיר: ל-200 נשים מתוך 1000 יהיה אבחון חיובי שגוי. 30 נשים יעברו ביופסיה ללא צורך. 15 נשים יקבלו טיפול מיותר לסרטן שהן לא חולות בו. החוקרים לא דנים בנזקים הפסיכולוגיים האפשריים שייגרמו ל-185 נשים שקיבלו אבחנה חיובית שגויה אך איכשהו ניצלו מטיפול מיותר ומזיק.

לעשות ממוגרפיה או לא לעשות?

למרות כל מה שנכתב כאן, אין תשובות חד משמעיות. יש גם מחקרים שטוענים כי התועלת בממוגרפיה עולה על הנזק. אין מחלוקת בקרב הקהילה הרפואית כי ממוגרפיה טומנת בחובה גם נזקים. גם אין מחלוקת כי ממוגרפיה שנעשית מתחת לגיל 50 אינה יעילה אצל נשים שלא נמצאות בקבוצות סיכון ספציפיות. בהחלט יש מחלוקת בדבר היעילות של הממוגרפיות לאחר גיל 50. ההמלצה של רשויות הבריאות כיום היא לבצע ממוגרפיה דו שנתית החל מגיל 50. עם זאת, ישנם ארגונים ועמותות הממליצים על בדיקות ממוגרפיה בגילאים צעירים יותר ובתדירות גבוהה יותר[8].

הדבר הנכון שכל אשה צריכה לעשות זה להחליט בעצמה מה לעשות, רצוי מאוד בהתייעצות עם רופאה (או רופא), ותוך כדי בחינה של הנתונים, והערכת התועלת האישית שלה מול הנזק האישי שלה. על הרופאות, לעומת זאת, מוטלת חובה לתקשר את מאזן התועלת והנזק, כפי שתואר במאמר של הניו-אינגלנד שסקרתי זה עתה. האם הרופאות מודעות למחקר הזה ולמחקרים דומים, ויודעות לתקשר את הסיכונים? אני לא בטוח. באתר של עמותת "אחת מתשע" לא מצאתי אזהרות או אזכורים של הסיכונים האפשריים של בדיקות הממוגרפיה.

מה אפשר ללמוד מכל זה?

הנטייה לפסול אמירות שמקורן בקבוצות ופורומים של מתנגדי חיסונים, רפואה הוליסטית וכיוצא בזה היא מסוכנת. מי שמצוי בסוגיית החיסונים, וניזון ממקורות מידע אמינים, למשל מהאתר של עמותת מדעת, יכול לדחות טענות של התנגדות לחיסונים על הסף. אבל זה לא אומר שכל דבר צריך להיפסל על הסף, אפילו אם הוא נכתב על ידי מתנגד סיכונים.

גם הזלזול בכתבות מאתרים כמו healthy-holistic-living נקודה קום עלול להתגלות כבעייתי. נכון שבהרבה מאוד מקרים נכתבות שם שטויות, ואף נכתבים דברים מסוכנים: הומיאופתיה, התנגדות לחיסונים, ועוד. עם זאת, יש לנקוט גישה ספקנית וביקורתית: לקרוא בצורה ביקורתית, לברר האם יש אסמכתאות לטענות, ואז להעריך את מידת האמון שיש לתת בדברים. נכון, זה קשה, ולא לכל אחד יש את הרצון והיכולת. הבעיה היא שלפעמים אנשים שאין להם רצון או יכולת מסתמכים על הרגש כמו שקרה בתגובות לפוסט הזה. ואנשים שמסתמכים על הרגש ולא על הנתונים יש לנו מספיק בקבוצות כמו "חיסונים בחירה מושכלת".

הבהרה

למרות שבפוסט זה תמכתי בהודעה שהופיעה בקבוצת "חיסונים בחירה מושכלת", אין להסיק מכך שאני מתנגד לחיסונים מכל סוג שהוא. אדרבא.


הערות
  1. למשל, בדיקות לגילוי מוקדם של סרטן הערמונית []
  2. נכון למועד כתיבת שורות אלה []
  3. קרן לנדסמן סקרה את המחקר הזה בבלוג שלה: http://bit.ly/2xyFEFM. אומר בנימוס כי אני לא מסכים עם הניתוח שלה []
  4. וספק אם זה אכן כך []
  5. הנובעים מטעויות חיוביות שליליות []
  6. ושוב, יש ספק גם לגבי הנתון הזה []
  7. הפתעה: השיעורים האלה גבוהים במיוחד בארצות הברית []
  8. לא ברור לי על סמך מה []

איך יודעים כמה אנשים מתים מנזקי העישון

מחדליו של סגן שר הבריאות בנושא המלחמה בעישון, תוארו בדו"ח של מבקר המדינה מחודש מאי 2018. בין היתר נאמר כי בכל שנה מתים בישראל כ-8,000 בני אדם כתוצאה ממחלות הנגרמות מעישון. יש לי הרבה מה לומר על אוזלת היד וחוסר המעש של מקבלי ההחלטות בנושא, אבל כאן אני מדבר בעיקר על סטטיסטיקה, והנושא שיעלה היום לדיון הוא הנתון בדבר המוות של 8000 בני אדם בשנה כתוצאה מעישון. איך יודעים את זה?

זהו כמובן אומדן שמתבסס על איסוף נתונים ויישום של שיטות סטטיסטיות. גם זה, כמו הרבה דברים אחרים, מתחלק לשלושה חלקים. החלק הקשה הוא החלק שבו אוספים את הנתונים. החלק הקל הוא החלק שבו מחשבים את החישובים (מזינים את הנתונים למחשב ולוחצים על הכפתור). וביניהם יש את החלק בו צריכים להבין מה עושים, ובאופן עקרוני זה לא מסובך.

כמה אנשים מתים?

נתחיל באיסוף הנתונים. נתון אחד שצריך לדעת הוא כמה אנשים מתים בכל שנה. זה לא קשה, לפחות במדינה מסודרת שבה נאספים נתונים כאלה באופן מסודר וקבוע. נתוני תמותה נאספים בדרך כלל במשך שנים רבות. הלשכה המרכזית לסטטיסטיקה מפרסמת בכל חמש שנים לוחות תמותה המבוססים על הנתונים שנאספו בחמש השנים שקדמו לשנת הפרסום. מייד נעיין באחד הלוחות (קישור לקובץ pdf). הנה קטע מלוחות התמותה של הלשכה המרכזית לסטטיסטיקה, המתייחס לגברים יהודים ואחרים (כלומר – לא ערבים), בין השנים 2011 ל-2015:

 

 

 

 

 

 

 

אני יודע שהסיכוי שלי למות בסופו של דבר הוא 100%. אבל אני בעזרת לוח התמותה יכול לדעת יותר מזה. אני גבר יהודי בן 55, ומהשורה האחרונה של לוח התמותה שבתמונה אני יכול ללמוד כי בהיעדר כל מידע נוסף, הסיכוי כי אמות בשנה הקרובה הוא 0.00425. לחילופין, על פי נתוני הלשכה, מתוך כל 100000 גברים יהודים, 95506 יגיעו לגיל 56, ו-4494 לא יזכו לכך. אני יודע שיש חוסר תיאום בין שני המספרים האלה, וזה נובע מתוך דקויות סטטיסטיות שלא אכנס אליהן כאן[1]. אני גם יכול ללמוד מהלוח כי תוחלת החיים שלי, בהינתן שכבר הגעתי לגילי המופלג, היא 27.6 שנים פלוס מינוס סטיית תקן ואירועים לא צפויים. יש גם סיכוי שאגיע לגיל 100, אך הוא קטן למדי.

לעומת זאת, לגבר ערבי בגיל 55 במדינת ישראל, הסיכוי למות לפני גיל 56 יותר גבוה: 0.00595, ותוחלת החיים שלו נמוכה יותר: נותרו לו, בממוצע, רק עוד 24.9 שנים לחיות.

איזה נתונים צריך כדי לאמוד את סיכוני העישון?

הנתון השני צריך לאפשר לנו לאמוד כמה אנשים מתו מנזקי עישון. זה כבר יותר מסובך. כולם מתים בסוף, גם אלה שמעשנים וגם אלה שלא. אדם יכול לעשן ולמות מסיבה שלא קשורה לעישון (אולי ממחלה זיהומית, אולי מתאונה, ואולי אפילו מסרטן שעישון אינו גורם סיכון שלו – יש סרטנים כאלה). אדם יכול לא לעשן ובכל זאת למות מסרטן הריאות או מחלת לב – כאשר עישון הוא גורם סיכון ידוע לשני המצבים הבריאותיים האלה.[2] ובכל זאת, הנתונים שיש לאסוף הם כמה אנשים מתים, כמה מהם מעשנים, וכמה לא.

במקומות רבים בעולם נערכים מחקרים תצפיתיים ארוכי טווח העוקבים אחרי מהלך החיים של אוכלוסיות, ואוספים נתונים על התנהגויות העשויות להשפיע על מצב הבריאות של הפרטים באוכלוסייה, כגון הרגלי אכילה ועישון. המחקר הידוע ביותר נערך בעיר פראמינגהם במדינת מסצ'וסטס בארצות הברית. החל משנת 1948 נאספים נתונים כאלה על אלפים מתושבי העיר שהסכימו להשתתף במחקר, והוא עוקב כעת אחרי הדור השלישי של התושבים. באתר המחקר תוכלו למצוא מחשבונים שבעזרתם תוכלו לדעת מה הסיכון שלכם ללקות במחלת לב. המחקר הזה הראה כי עישון הוא גורם סיכון משמעותי לסיכוי לחלות במחלת לב.

מחקר אחר, קצת ישן (משנת 1999) שערכו יעקובס ועמיתיו, עקב אחרי אוכלוסייה של כ-12000 איש בשבע מדינות במשך 25 שנים. המחקר אסף נתוני תמותה מכל סיבה שהיא, וכמובן נתונים נוספים. אחת המסקנות של המחקר הזה הייתה כי הסיכון למות של מעשנים המעשנים עד 10 סיגריות ביום גבוה פי 1.3 מהסיכון של לא מעשנים, והסיכון למות של אלה המעשנים יותר מ-10 סיגריות ליום גבוה פי 1.8 מאלה של הלא מעשנים. ללא הסבר המספרים האלה נראים תמוהים. מה זאת אומרת שהסיכון למות גבוה פי 1.8? כולם מתים בסוף. הסיכון למות הוא 100% לכולם. לא? לא. הסיכוי שאדם ימות בסופו של דבר הוא אכן 100%. הסיכון הוא לא סיכוי. אז בואו נעשה סדר.

איך מודדים את הסיכון

הסיכון נגזר מהסיכוי למות (או לחוות אירוע אחר כלשהו, כמו התקף לב למשל) במשך יחידת זמן מוגדרת, ומתייחס לנקודה ספציפית בזמן (או לתקופת זמן קצרה מאוד). אל תיבהלו, אבל אני אומר לכם שהסיכון הוא הנגזרת של ההסתברות המותנה למות (אתם יכולים לעבור הלאה בלי חשש). הסיכוי, לעומת זאת, מתייחס לתקופות זמן ארוכות יותר.

אני לא אכנס כאן להגדרה המתמטית המדוייקת של הסיכון. אומר רק שאם יודעים את הסיכוי למות במשך תקופת מסויימת, נניח שנה, אפשר לחשב מכך את הסיכון למות במשך אותה תקופת זמן. גם ההיפך נכון: אם יודעים את הסיכון אז יודעים את הסיכוי. כמו כן, באופן לא מפתיע, אם הסיכוי שלך למות בשנה הקרובה גבוה יותר, אז גם הסיכון שלך גבוה יותר.

ואם אפשר לעשות את האבחנה הזו בין יהודים וערבים, ובין גברים לנשים, בוודאי שאפשר לחשב את הסיכון של המעשנים ולהשוות אותו לסיכון של הלא מעשנים.

הכלי הסטטיסטי שמאפשר לבצע את התרגילים האלה הוא מודל הסיכונים הפרופורציונליים שפותח בשנת 1972 על ידי הסטטיסטיקאי הבריטי סיר דויד קוקס, וידוע גם בשם מודל קוקס. קשה להמעיט בחשיבות של המודל הזה. המאמר שבו הוצג המודל נמנה עם 100 המאמרים המדעיים המצוטטים ביותר בכל הזמנים – לא מאמרים בסטטיסטיקה, אלא כל המאמרים המדעיים.  המודל מאפשר לזהות גורמי סיכון  להתרחשות אירועים כגון מוות, ולמדוד מה פוטנציאל הסכנה בכל גורם סיכון כזה. בנוסף לכך, קוקס הציג במאמר שלו חידושים סטטיסטיים נוספים שהשפיעו רבות גם על תחומים אחרים בסטטיסטיקה. אילו היה פרס נובל לסטטיסטיקה, סיר דויד קוקס היה זוכה בו ללא צל של ספק. סיר קוקס אכן זכה כמעט בכל פרס אפשרי בתחום הסטטיסטיקה. המודל שלו בפירוש מאפשר הצלת חיים. לדעתי סיר קוקס ראוי לזכייה בפרס נובל לרפואה.

להלן נוסחת המודל. מייד אסביר הכל. ניתן לראות כי זהו למעשה מודל רגרסיה.

 

 

נתחיל בצד שמאל. שם מופיע הסיכון כפי שהוא מושפע מגורמי הסיכון – אותו אנחנו רוצים לאמוד. הוא מסומן באות למבדה – האות היוונית שדומה לאות ג. בצד ימין יש מכפלה של שני חלקים. חלק אחד מתאר את הסיכון הבסיסי – כאשר אין שום אינפורמציה. הוא מסומן בלמבדה אפס טי. הסיכון הבסיסי נקבע רק על פי נתוני התמותה. לכל אדם במדגם נתון האם הוא מת, אם כן, מתי, ואם לא, כמה שנים הוא חי עד למועד שבו הוחלט להפסיק את המעקב ולהזין את הנתונים למודל. החלק השני מכיל את גורמי הסיכון האפשריים, כגון גיל, מין, הרגלי אכילה, וגם כמובן משתנה המציין האם האדם שבמדגם מעשן או לא. גורמי הסיכון מסומנים באיקסים. לכל X יש מקדם שמסומן באות ביתא. אם ביתא שונה באופן משמעותי מאפס זה אומר שלמשתנה X יש השפעה משמעותית על הסיכון. אם ביתא חיובי זה אומר שהסיכון גדל ככל ש-X גדל, ואם ביתא שלילי זה אומר של-X יש דווקא השפעה חיובית. רמת הסיכון עולה (או יורדת) באופן פרופורציוני לערכו של .X[3] מכאן נובע שם המודל – מודל הסיכונים הפרופורציוניים. לאחר שאומדים את הפרמטרים של המודל אפשר, באופן תיאורטי, לחשב את הסיכון לאדם מעשן ולאדם לא מעשן.[4] בפועל, המודל מספק ישירות אומדן ליחס שבין הסיכונים, ה-hazard ratio. היחס הזה מתבטא במקדם הביתא של משתנה העישון.

למודל יש כמובן גם הנחות. החשובה שביניהן היא ההנחה כי יחס הסיכונים נשאר קבוע לאורך כל תקופת המעקב. זו הנחה חזקה, ובדרך כלל היא נכונה, וגם אם יש סטייה לא גדולה מההנחה הזו המודל מספיק עמיד (robust) כדי לספק אומדן טוב של הסיכון. יש הרחבות למודל שבהן מחליפים את ההנחה הזו בהנחה יותר גמישה אם יש צורך. אחד המודלים הידועים שמרחיבים את מודל קוקס פותח על יד שילה בירד.

איך מתרגמים את הנתונים למספרים

עכשיו נוכל לעשות את החישובים.

יש לנו את ההסתברויות למות בכל גיל מלוחות התמותה. יש לנו את גם יחס הסיכונים שהוא כזכור היחס בין הסיכון למות של אנשים המעשנים יותר מ-10 סיגריות ביום ובין הסיכון של לא מעשנים. זכרו כי זהו יחס הסיכונים לנקודה ספציפית בזמן. מתוך יחס הסיכונים אפשר לחשב את  יחס הסיכויים: היחס בין ההסתברויות למות במשך תקופת זמן מוגדרת, שנה למשל. בשביל זה יש נוסחה. אני אחסוך לכם אותה. יש בה אינטגרלים ואקספוננטים, וזה בדרך כלל לא טוב לבריאות. אם אתם ממש רוצים  אז אתם יכולים לקרוא כאן, למשל, אבל זה על אחריותכם (קישור לקובץ  pdf). אני חוסך את זה גם לעצמי, ואשתמש בנתון מתוך מאמר אחר מאת מהטה ופרסטון משנת 2012. לפי הנתונים במאמר הזה, יחס הסיכויים למוות בתקופת זמן של שנה, בין גברים מעשנים וגברים לא מעשנים הוא בערך 2.3 (לקחתי את הגבול התחתון של רווח הסמך, כדי לקבל הערכה שמרנית), לאחר תקנון לגיל, וזאת בארצות הברית, בשנים 1987 עד 2006.

אנחנו צריכים עוד נתון אחד והוא שיעור המעשנים באוכלוסייה. לצורך הדוגמה אשתמש בנתונים של משרד הבריאות משנת 2017, לפיהם כ-30% מהגברים מעל גיל 21 הינם מעשנים..

כשיש לנו את כל הנתונים מה שנשאר זה קצת אלגברה של בית ספר תיכון.[5]

נניח שהסיכוי של מעשן בן 55 למות לפני גיל 56 הוא X, והסיכוי של לא מעשן הוא Y. לפני הנתון של מהטה ופרסטון, X גדול פי 2.3 מ-Y, כלומר X=2.3Y. זה נותן לנו משוואה אחת המקשרת בין X ל-Y.

את המשוואה השנייה נגזור מתוך מה שידוע בשם נוסחת ההסתברות השלמה.  ניתן להציג את החישוב בצורת עץ הסתברויות:

 

 

 

 

 

 

 

 

 

מהי ההסתברות של גבר בן 55 למות? ההסתברות הזו שווה להסתברות שלו למות אם הוא מעשן שהיא כאמור X כפול ההסתברות שהוא מעשן, שהיא 30%, ולכך יש להוסיף את ההסתברות שלו למות אם הוא לא מעשן, Y, כפול ההסתברות שהוא לא מעשן, שהיא 70%.  כל זה צריך להיות שווה ל-0.00425, כלומר 0.3x+0.7y=0.00425.

עכשיו יש לנו שתי משוואות בשני נעלמים ואפשר לפתור אותן. הפתרון הוא ש-X, ההסתברות שגבר יהודי מעשן בן 55 ימות לפני שיגיע לגיל 56 – שווה ל-0.00703237, ואילו Y, ההסתברות שגבר יהודי בן 55 שאינו מעשן ימות לפני שיגיע לגיל 56 היא הרבה יותר נמוכה: 0.00305755.

כזכור, על פי לוח התמותה, ההסתברות שגבר בן 55 ימות לפני שיגיע לגיל 56 היא 0.00425. זה אומר שאם יש לנו 100000 גברים כאלה, אז בממוצע ימותו במהלך השנה 425 מהם. אם לעישון אין השפעה על ההסתברות למות, אז 30% מהמתים יהיו מעשנים: בערך 128 איש.

אבל אנחנו יודעים שההסתברות למות שונה למעשנים ולא מעשנים.

בין 100000 הגברים יש 30000 מעשנים, ולכל אחד מהם הסתברות למות השווה כאמור ל- 0.00703237. זה אומר שמתוכם ימותו 210 איש – 82 איש יותר ממה שהיה צריך להיות אילו לעישון לא הייתה השפעה. 82 האנשים האלה מתו לכן בגלל שהיו מעשנים.

כך אפשר לערוך את החישוב לכל מין, לכל גיל, ולכל קבוצת אוכלוסייה למעשה. אם עושים את החשבון עם כל הנתונים המדוייקים (שלא היו בידיי), אז מגיעים ל-8000 מחברים את תוצאות כל החישובים ומגיעים למספר הכולל.

מה בקשר לעישון פאסיבי

העקרון הוא אותו עיקרון, אם כי היישום יותר מסובך. אני חייב להודות שאני לא יודע באיזה שיטה משתמשים כדי לאמוד את מספר הנפגעים מעישון פאסיבי.

בגדול יש שתי אפשרויות: להגדיר באופן כלשהו משתנה המציין אם אדם נחשף לעישון פאסיבי או לא נחשף, ואז החישוב הוא כפי שנעשה קודם. אפשרות שניה היא להגדיר את רמת החשיפה לעישון פאסיבי כמשתנה כמותי ואז יחס הסיכונים פרופורציונאלי לרמת החשיפה. ברמה העקרונית החישוב נשאר אותו חישוב, אלא שכאן מדובר במשתנה רציף ולכן הפירוק להסתברויות לפי רמת החשיפה מסובך יותר.

כמה מילים בנימה אישית

וכאן אני רוצה לומר כמה מילים אישיות.

אני חושב שהנתון כי בכל שנה מתים בישראל 8000 איש מנזקי עישון הוא מזעזע. אם מחר תפרוץ חלילה מלחמה וימותו בה 8000 איש העם יצא לרחובות. אם השנה ייהרגו 8000 איש בתאונות דרכים, שר התחבורה והשר לביטחון פנים לא יוכלו להתחמק מאחריות. 8000 מתים בשנה פירושם יותר מ-20 מתים כל יום. אם חלילה יתרחש פיגוע וייהרגו בו 20 איש, אף אחד לא יחכה שהמספר יצטבר ל-8000 לפני שיידרשו לעשות משהו, ובצדק.

כמו שאמר סטאלין, מוות אחד הוא טרגדיה אבל 8000 מתים הם כנראה רק סטטיסטיקה. לסטטיסטיקה הזו אחראים המנהיגים שלנו ומקבלי ההחלטות. בשנת 2011 הוכרזה תכנית לאומית למלחמה בעישון ובנזקיו. בפועל לא קרה כמעט כלום. הגיע הזמן לתכנית חדשה, והפעם זו צריכה להיות תכנית חירום לאומית למלחמה בעישון. עכשיו.

 

 

 


הערות
  1. אתם מוזמנים לקרוא את דברי ההסבר בקובץ לוחות התמותה []
  2. נשאלת כמובן השאלה איך יודעים שאלה גורמי סיכון, והתשובה תתברר מייד []
  3. באופן יותר מדוייק: ההשפעה היא פרופורציונית לגבי הלוג של יחס הסיכונים []
  4. את זה עושים על ידי כך שקובעים ש-X הוא משתנה שמקבל שני ערכים: 0 אם האדם לא מעשן, 1 אם הוא כן מעשן. כאשר X שווה ל-1 נוסף הערך ביתא לסכום המשוקלל של גורמי הסיכון []
  5.  אני יודע שאני עושה פה סלט: נתונים מארצות הברית מסוף המאה העשרים ותחילת המאה העשרים ואחת, ונתונים מישראל. הכל נעשה לצורך הדגמה. אל תסיקו מסקנות מהמספרים שתראו בהמשך. []

איך נדע האם המכוניות האוטונומיות בטיחותיות

התאונה הקטלנית של אובר

העולם גועש בימים האחרונים בעקבות תאונת הדרכים הקטלנית בה היה מעורב רכב אוטונומי של חברת אובר. התאונה הציתה ויכוחים שונים והעלתה נושאים ישנים לדיון מחודש. מתנהל למשל ויכוח בשאלה מי אשם בתאונה. התשובה, כמובן, תלויה במי שעונה לשאלה (אני לא מביע את דעתי בנושא הזה, ומבקש מכל מי שרוצה להביע את דעתו, שלא יעשה את זה בתגובות לפוסט הזה. זה לא המקום). הרשת התמלאה בשמועות על כך שנושא בטיחות המכוניות האוטונומיות אינו בעדיפות עליונה אצל חברת אובר. כמו כן ניצתו מחדש דיונים בתחום האתיקה שאמורה להדריך (אולי) את מתכנני המכוניות האוטונומיות. כך למשל, דפנה מאור, במאמר בעיתון דה-מרקר, שואלת שאלות חשובות במאמר עם הכותרת הפרובוקטיבית "האם תסכימו להידרס על ידי רובוט?" אמיתי זיו ענה לה שאם יידרס, אז הוא מעדיף להידרס על ידי מכונית אוטונומית (לא ברור לי למה זה משנה לו). אתם מוזמנים לקרוא את המאמרים האלה ומאמרים אחרים ולנהל דיונים ביניכם (אם כי, אני שוב מבקש להימנע מלנהל את הדיון הזה כאן בבלוג).

עוד כתבה מעניינת בדה-מרקר נשאה את הכותרת "אחת החולשות העיקריות של מכוניות אוטונומיות היא זיהוי הולכי רגל". הכותרת היא ציטוט של דברים שאמר אחד המרואיינים בכתבה, דני עצמון (שהינו בעל חברה המפתחת סימולטורים שנועדו לאמן ולשפר את היכולת של מערכות אוטונומיות ברכבים).

עצמון אמר דברים מעניינים נוספים. אני מצטט:

מכון ראנד האמריקאי ביצע בדיקה סטטיסטית שבאמצעותה קבע "רף נהיגה אנושי". "הם לקחו את על ההרוגים בתאונות בארה"ב ב-2015 וחילקו במספר המיילים שנסעו – וגילו שיש 1.1 הרוגים על כל 100 מיליון מיילים של נסיעה. זה הוגדר הרף האנושי – הביצועים של האדם די טובים… המכון חישב ומצא שכדי שמערכות אוטונומיות יגיעו לאותם ביצועים כמו של בני אדם בביטחון של 95%, עליהן לנסוע 11 מיליארד מייל. "בשנה שעברה כל החברות שעוסקות בתחום הזה בארה"ב נסעו ביחד בערך 4 מיליון מייל.

אז בואו נדבר על הסטטיסטיקה.

הסטטיסטיקה של תאונות הדרכים

אני חושב שכולכם תסכימו שככל שנוסעים יותר, יש יותר אינפורמציה על הסיכון לתאונות. אני למשל, לא הייתי מעורב באף תאונת דרכים עם נפגעים בשנתיים האחרונות. מצד שני, אני בקושי נוהג שתי נסיעות קצרות בעיר בכל שבוע[1] שמסתכמות אולי ב-15 קילומטר, שהם קצת פחות מ-800 קילומטר בשנה. ככל שנוסעים יותר, הסיכון להיות מעורב בתאונת דרכים גדל. נכון שהסיכון שונה מנהג לנהג, יש נהגים יותר זהירים ויש כאלה שפחות, אבל העיקרון ברור. לכן יש הגיון בחישוב של מכון ראנד שלוקח את מספר ההרוגים ביחס לכמות הנסועה. מייד אסביר את העקרונות של החישוב, ואציג כמה חישובים משל עצמי.

לפני שאתחיל בחישובים, אציג כמה נתונים שפירסמה הלשכה המרכזית לסטטיסטיקה. בשנת 2015 היו בישראל 12122 תאונות עם נפגעים, מתוכן 292 תאונות קטלניות, 1558 תאונות עם פצועים קשה, ו-10272 תאונות עם נפגעים בדרגת פציעה בינונית או קלה. בתאונות האלה נהרגו 322 איש, 1796 איש נפצעו קשה, ו-20046 איש נפצעו בינוני או קל. ומכאן שהיו תאונות קטלניות בהן היה יותר מהרוג אחד, והוא הדין לגבי הנפגעים האחרים. לכן אתייחס בהמשך למספר התאונות ולא למספר הנפגעים.

האם המספרים האלה גבוהים או נמוכים? תלוי איך מסתכלים על הנתונים. אל תטעו. לדעתי כל תאונה היא טרגדיה. עם זאת, לפעמים צריך להסתכל על המספרים עצמם, וזאת כדי שיהיה אפשר לקבל החלטות מושכלות. כמו שדני עצמון הסביר, צריך להסתכל גם על הנסועה – שהיא סך כל הנסיעות שנסעו כלי הרכב במדינה.[2]. לפי נתוני הלשכה המרכזית לסטטיסטיקה, הנסועה בישראל בשנת 2015 הייתה 54,820 מיליון ק"מ, כלומר כמעט 55 מיליארד ק"מ. מכאן אפשר לחשב כי על כל מיליון ק"מ של נסועה היו בשנת 2015 היו בישראל 0.00533 תאונות קטלניות. זה נראה כמו מספר יותר קטן, אבל זה רק עניין של קנה מידה. באותו אופן ניתן לחשב כי בישראל היו 0.02842 תאונות דרכים עם פצועים קשה (אך ללא הרוגים) לכל מיליון ק"מ, ו-0.18737 תאונות שבהן היו פצועים בינוני או קל (אך לא פצועים קשה ולא הרוגים). בסך הכל היו בישראל 0.22295 תאונות עם נפגעים לכל מיליון ק"מ של נסועה.

הסטטיסטיקאים מכנים את המספרים המתארים את מספר התאונות למיליון ק"מ בשם "קצב התאונות" (או rate באנגלית). זה מדד כללי המתאר את מספר האירועים ליחידת מדידה (בדרך כלל זמן, אך כפי שראיתם, יש גם יחידות מדידה אחרות). דוגמא נוספת[3] לנתונים כאלה יכולה להיות המספר הממוצע של גידולים ממאירים חדשים המתגלים במשך חודש. לפני נתוני הלמ"ס, בשנת 2013 היו בישראל בסך הכל 13546 גברים אצלם התגלו גידולים ממאירים חדשים. זה אומר שקצב הופעת הגידולים החדשים היה בקירוב 1128.8 בחודש.

איך להעריך את רמת הבטיחות של המכוניות האוטונומיות?

עכשיו, כאשר הבנו את הנתונים האלה ומשמעותם, אנחנו יודעים איך להעריך את הבטיחות של המכוניות האוטונומיות. צריך לחשב מהו קצב התאונות שלהן, ולהשוות אותו לקצב של המכוניות ה-"רגילות".

כאן אנחנו נתקלים בבעיה הראשונה: אין נתונים. אנחנו יודעים כי הנסועה הנוכחית של המכוניות האוטונומיות היא בערך 4 מיליון מייל, אבל לא יודעים כמה תאונות היו. לכן אנחנו גם לא יודעים האם מספר ההרוגים עד כה (1) הוא גבוה או לא. מה שאנחנו כן יכולים להגיד במידה רבה של בטחון הוא שגודל המדגם קטן מדי. לפי גודל המדגם הנוכחי האומדן שלנו לקצב התאונות הקטלניות של המכוניות האוטונומיות הוא 0.15385 למיליון ק"מ, כמעט פי 29 מהנתון המקביל של ישראל בשנת 2015. עם זאת, יש לסייג את הדברים ולומר כי האומדן הזה מאוד לא מדוייק, שוב, בגלל גודל המדגם הקטן.  רווח הסמך לקצב, ברמת סמך של 95%, הוא 0.0053 עד 0.5535. זה אומר שייתכן מאוד שקצב התאונות הקטלניות של המכוניות האוטונומיות דומה לקצב של ישראל. שוב, ככל שיצטברו יותר נתונים, האומדן יהיה מדוייק יותר, ובהחלט יכול להיות שב-4 מיליון המייל הבאים לא תהיה אף תאונה קטלנית, ואז אומדן הקצב יקטן ב-50%.

רבים טוענים כי המכוניות האוטונומיות הינן בטוחות יותר ממכוניות רגילות, ואני נוטה להסכים איתם באופן חלקי (אם כי, כמו תמיד, אלוהים מצוי בפרטים הקטנים – ראו שוב את מאמרה של דפנה מאור). אך טענות צריך לגבות בנתונים, וכאמור, אין לנו מספיק נתונים. לכן השאלה שצריך לשאול היא: כמה נתונים צריך כדי שנוכל לומר משהו אינטליגנטי ומגובה בנתונים על הבטיחות של המכוניות האוטונומיות?

כפי שכבר הבנתם, הסטטיסטיקאים של מכון ראנד כבר ערכו חישוב כזה. אני מודה שאני לא כל כך מבין את הנתון של 11 מיליארד מייל שדני עצמון ציטט, ואני מניח שחלק מהדברים "אבדו בתרגום". בכל מקרה, אני מתכוון להציג כאן את העיקרון שלפיו עורכים את החישובים, ולהציג את התוצאות של החישובים שלי.

מודל להתרחשות תאונות דרכים

קוראיי הוותיקים כבר יודעים: כדי לבצע את החישובים הסטטיסטיים יש צורך במודל הסתברותי. להזכירכם, מודל הוא תיאור של המציאות, שייתכן שאינו מדוייק לגמרי, אבל הוא מספיק טוב כדי לתת תשובה אמינה לשאלה שלנו. כל מודל מתבסס על הנחות. הנחות שונות יובילו למודלים שונים ולתשובות שונות.

המודל שאציג לקצב תאונות הדרכים מתבסס על הנחה יחידה: הפיזור של התאונות לאורך השנה הוא אחיד. במילים אחרות, אין תקופות בשנה שיותר מועדות לתאונות מאשר תקופות אחרות. אפשר כמובן להניח הנחות אחרות, שיגדירו מודלים יותר מסובכים. אני אגביל את עצמי למודל הפשוט, כיוון שהמטרה העיקרית שלי היא להסביר את העקרונות הסטטיסטיים. עם זאת, אני לא חושב שמודל מסובך יותר ייתן תוצאות שונות באופן משמעותי, וזאת לאור הניסיון שצברתי במשך השנים בניתוח נתונים דומים.

מההנחה שלי אפשר, עם קצת מתמטיקה, להסיק כי מספר התאונות בשנה הוא משתנה מקרי פואסוני. שוב קוראיי הוותיקים אולי זוכרים שהמודל הזה וההתפלגות הנובעת ממנו הוזכרו כבר בבלוג. זה המודל בו השתמשו הבריטים כדי לבדוק מה הייתה רמת הדיוק של הטילים שהמטירו עליהם הגרמנים בזמן הבליץ על לונדון. למשתנה מקרי שהתפלגותו היא התפלגות פואסון יש פרמטר אחד בלבד – פרמטר הקצב. בישראל של 2015 קצב התאונות הקטלניות היה כזכור 0.00533 למיליון קילומטר. השאלה המעניינת היא: כמה מיליוני ק"מ צריכות המכוניות האוטונומיות לנסוע כדי לנוכל לומר על סמך הנתונים כי קצב התאונות שלהם נמוך מקצב התאונות הקטלניות של ישראל באופן משמעותי?  עם קצת מתמטיקה לא מסובכת במיוחד אפשר לפתח נוסחה שנותנת את התשובה. הנה היא, לא להיבהל, תיכף אסביר הכל, ומי שלא מעוניין בהסברים יכול לדלג הלאה, אל המספרים שחישבתי.

חישוב גודל המדגם בהתפלגות פואסון

 

 

 

 

ההסברים: למבדה-אפס (האות שדומה לאות העברית גימל) מייצגת את קצב הבסיס שאליו אנחנו  רוצים להשוות את הקצב מהמדגם. בדוגמא שלנו קצב הבסיס הוא הקצב של תאונות הדרכים הקטלניות בישראל, כלומר 0.00533 תאונות למיליון קילומטר. האות דלתא (שדומה לאות למד בעברית) מייצגת את ההבדל המשמעותי בין קצב התאונות במדגם (כלומר קצב התאונות של המכוניות האוטונומיות) ובין קצב הבסיס. לדוגמא, אם אנחנו חושבים שהבדל משמעותי יהיה ירידה של 10% בקצב התאונות, הרי שאנו מצפים שקצב התאונות של המכוניות האוטונומיות יהיה 0.004797 (90% מ-0.00533), ולכן ההפרש דלתא שווה ל–.000533. שימו לב שההפרש הוא שלילי. אלפא וביתא הן רמת המובהקות והעוצמה, אני אשתמש בערכים של 5% -90% בהתאמה, והאות Z מסמלת ערכים של ההתפלגות הנורמלית, והם שווים ל-1.645 עבור רמת המובהקות ו- -1.282עבור העוצמה. התוצאה שמתקבלת על ידי החישוב, n, היא גודל המדגם הדרוש, שהוא במקרה שלנו, מספר מיליוני הקילומטרים שהמכוניות האוטונומיות צריכות לנסוע.

מה גודל המדגם הדרוש להערכת הבטיחות?

אם נציב את כל המספרים בנוסחה נקבל כי כדי שנוכל לזהות ירידה מובהקת של 10% בקצב התאונות הקטלניות, נצטרך לראות מה קורה אחרי שהמכוניות האוטונומיות ייסעו 9215 מיליון ק"מ, שהם בערך 6 מיליארד מייל. זה אמנם מספר קטן יותר מהמספר שצוטט בכתבה[4], אבל זה עדיין מספר מטורף. (אני נותן כאן קישור לקובץ אקסל שבעזרתו ביצעתי את החישובים. אתם מוזמנים לבדוק עוד תרחישים).

אחת הסיבות שקיבלנו מספר כל כך מטורף היא שהגדרנו ירידה מאוד קטנה כמשמעותית – רק 10%. יש הטוענים כי כשהמכוניות האוטונומיות ייכנסו לשימוש מסחרי קצב התאונות (או מספר התאונות, שזה בעצם אותו דבר), ירד בצורה הרבה יותר משמעותית. אם זה נכון, גודל המדגם יהיה הרבה יותר קטן. על פי אותה הנוסחה, כדי לזהות באופן מובהק ירידה של 50% בקצב תאונות הדרכים הקטלניות, יש צורך בגודל מדגם של כ-471 מיליון מייל, וכדי לזהות ירידה משמעותית של 90% במספר תאונות הדרכים הקטלניות באופן מובהק יש צורך בגודל מדגם של קצת פחות מ-220 מיליון מייל.

החדשות הטובות הן שכדי לזהות ירידה מובהקת של 90% בקצב הכולל של תאונות דרכים עם נפגעים יש צורך בגודל מדגם של קצת יותר מ-5 מיליון מייל, ואנחנו כמעט שם. מצד שני, יש המון חברות שעורכות המון ניסויים, ולא סביר שיוקם מאגר נתונים בו יקובצו הנתונים של כל החברות, שהרי כל חברה רוצה לשמור את הנתונים שלה בסוד מהמתחרות. אז אנחנו לא באמת מתקרבים ליעד של 5 מיליון מייל.

עוד חדשות טובות: הנסועה השנתית בארצות הברית היא קצת יותר מ-3 טריליון מייל, כלומר 3000 מיליארד מייל (או 3 מיליון מיליוני מייל), כך שאם באורח פלא כל המכוניות בארצות הברית יהפכו להיות אוטונומיות, נדע את כל התשובות תוך יום בערך. זה לא יקרה כמובן. אפשר להמשיך ללהטט בחישובים שייקחו בחשבון את קצב חדירת המכוניות האוטונומיות לשימוש, אבל אני אעצור כאן.

מתי נדע האם המכוניות האוטונומיות בטיחותיות?

המסקנה שלי היא שייתכן שנדע יחסית בקרוב (אם תהיה התערבות רגולטורית) האם המעבר למכוניות אוטונומיות יביא לירידה מאוד גדולה (90%) במספר תאונות הדרכים עם נפגעים. אם הירידה קטנה יותר, נצטרך לחכות זמן רב יותר. בקשר לתאונות דרכים יותר חמורות, כאלה עם פצועים קשה או תאונות קטלניות, יעבור עוד המון זמן עד שנדע משהו. מה שיקרה בפועל הוא שמכוניות אוטונומיות ייכנסו לשימוש בלי שיהיה לנו מושג ירוק על רמת הבטיחות שלהן.


הערות
  1. פעם אחת לקניות, ופעם אחת כדי להסיע את הילד לחוג []
  2. לדוגמא, אם 10 מכוניות נסעו מתל אביב לחיפה, מרחק של 100 ק"מ, אז הנסועה הכוללת שלהן הייתה 10×100 כלומר 1000 ק"מ []
  3. תסלחו על על הדוגמאות המדכאות []
  4. אני לא יודע מה היו ההנחות שלהם ומה הם חישבו בדיוק []

"המחשב טעה. שלא תדעו עוד צער."

האם מקצוע הרדיולוג עומד להיכחד? האם אלגוריתמים של בינה מלאכותית, כגון רשתות נוירונים, יחליפו את הרדיולוגים, ובהמשך את שאר הרופאים? ואיך כל זה קשור למכוניות אוטונומיות?

כל השאלות האלה עלו בעקבות פוסט בבלוג  Toward Data Science שפרסם יו הארווי, רופא המתמחה ברדיולוגיה. הארווי טוען כי האלגוריתמים לא יחליפו את הרדיולוגים בעתיד הנראה לעין, אם בכלל. בדיון בקבוצת Machine & Deep learning Israel בפייסבוק הופיע הפניה לפוסט של לוק אוקדן-ריינר, גם הוא רופא המתמחה ברדיולוגיה.  הפוסט של אוקדן-ריינר מתייחס למאמר שפורסם ממש לפני כמה חודשים (נובמבר 2017), מאת רג'פורקאר ועמיתיו, שתיאר אלגוריתם לפענוח תצלומי רנטגן. בין העמיתים החתומים על המאמר זה נמנה אנדרו אנג, מה שמחייב התייחסות רצינית ביותר למאמר.

ברשימה זו אביא את דבריהם של הארווי ואוקדן-ריינר, ואתייחס למאמר של רג'פורקאר. כמו כן, אומר מה לדעתי צריכים להיות הקריטריונים לפיהם יהיה ניתן לקבוע כי אלגוריתם כזה יכול להחליף רופא מומחה. בנוסף אענה באופן מסודר לטענות (הטובות) שהועלו בקבוצת הפייסבוק.[1]

זוהי רשימה ארוכה במיוחד. חילקתי אותה למספר פרקים כשלכל פרק כותרת נפרדת, כדי שתוכלו לדלג על הפרקים שלא מעניינים אתכם.

הארווי: אינטליגנציה מלאכותית לא תחליף את הרדיולוגים

ד"ר הארווי, שכנראה לא היה מודע למאמר של ראג'פורקאר כשכתב את דבריו[2] משיב לטענתו של ג'פרי הינטון, מומחה לרשתות נוירונים, שאמר כי "ברור שצריך להפסיק להכשיר רדיולוגים". הוא מביא שלושה טיעונים כתשובה להינטון.

ראשית, טוען הארווי, כי בניגוד לאלגוריתם, הרדיולוג עושה יותר מאשר להביט בהדמיות[3]. הארווי מתאר בפירוט את תפקידיו של הרדיולוג בתהליכי האבחון, שאמנם מתבססים על הדמיות, אך גם על אינפורמציה נוספת. הוא אמנם מסכים כי אלגוריתמים למיניהם עשויים לסייע ולשפר כמה תחנות בתהליך האבחוני, אך אינם יכולים להחליף את שיקול הדעת של הרופא.

הנימוק השני של הארווי הוא שבסופו של דבר מי שנושא באחריות הסופית הם בני אדם. הארווי מציג אנלוגיה בין התעופה ובין הרפואה (לא מוצלחת, לדעתי), אולם בסופו של דבר מדגיש את הנקודה המהותית: כשהרופא טועה, ורופאים אכן עלולים לטעות, הרופא אחראי. מי יהיה אחראי במקרה שבו האלגוריתם טעה? האם החברה שמכרה לבית החולים את המערכת שמפענחת תצלומי רנטגן תהיה מוכנה לקחת אחריות על מקרה שבו חולה ימות כי האלגוריתם טעה ולא זיהה כי הפציינט חולה בדלקת ריאות? אולי החולה שהסכים להפקיד את בריאותו בידיו של האלגוריתם (בהנחה שהייתה לו ברירה) אחראי? הרי אף אחד לא יעלה בדעתו שהרופא ששלח את החולה הבייתה כי האלגוריתם אמר שהוא בריא יהיה אחראי. או שכן? הארווי טוען שאף מערכת AI לא תהיה מדוייקת ב-100%. זה נכון, אבל לדעתי הטענה הזו מחלישה את הטיעון שלו. הרי גם רופאים טועים. עם זאת טוען הארווי כי רופאים עשויים לתפקד טוב יותר מאלגוריתם במקרי קצה, וכאן אני נוטה להסכים איתו.

הטענה השלישית של הארווי פחות רלוונטית לנושא של השוואת הביצועים של רופאים ואלגוריתמים רפואיים. הוא טוען כי כאשר יוכנסו מערכות AI למיניהן ויחליפו חלק מהשלבים בתהליך האבחוני, התהליך אכן יתייעל, אולם זה רק ייצור יותר ביקוש לשירותי רדיולוגיה, הביקוש לרדיולוגים יעלה ויגבר הצורך בהכשרת רדיולוגים נוספים.

ראג'פורקאר: האלגוריתם יכול לאבחן דלקת ריאות יותר טוב מהרופאים

הפוסט של אוקדן-ריינר מתייחס למאמר של רג'פורקאר. לכן אסקור בקצרה את הרעיון הכללי של מאמר, ואחר כך אביא את דבריו.

ראג'פורקאר ועמיתיו (שמכאן והלאה אכנה בשם "החוקרים") נעזרו בבסיס נתונים שהכיל יותר מ-100 אלף תצלומי רנטגן של החזה, של כ-38 אלף חולים ב-14 מחלות שונות, וביניהן דלקת ריאות. כל חולה סווג כחולה בדלקת ריאות, או כלא חולה בדלקת ריאות. הנתונים חולקו לפי כל כללי הטקס[4] לשלושה קובצי נתונים נפרדים.

ראשית הם השתמשו בנתונים של כ-29 אלף חולים, ובסך הכל כ-99 אלף תצלומים לצורך "אימון המודל"[5], כ-3.5 תצלומים לחולה, בממוצע.

לאחר שאימנו את המודל, עברו לקובץ השני, בו היו כ-6400 צילומים של כ-1700 חולים (3.8 צילומים לחולה, בממוצע). בעזרת קובץ זה הם ביצעו תיקוף (ולידציה) של המודל.

לסיום, בחנו את ביצועי המודל על הקובץ השלישי, שהכיל 420 צילומים של 389 חולים (כ-1.08 תצלומי רנטגן לחולה, בממוצע).[6]

בתהליך הבחינה 420 התצלומים נבדקו על ידי ארבעה רדיולוגים מאוניברסיטת סטנפורד שסיווגו את החולים לאחת מ-14 המחלות שהיו בקובץ המקורי, וכמובן שגם האלגוריתם אמר את דברו. לרדיולוגים לא היה כל מידע רפואי על החולים מעבר לתצלומי הרנטגן, וכמו כן הם לא ידעו את השכיחויות של כל אחת מ-14 המחלות בקובץ המקורי. במילים אחרות, היה להם בדיוק את אותו המידע שהיה לאלגוריתם.

החוקרים חישבו לכל אחד מהרדיולוגים, וגם עבור האלגוריתם, מדד ביצוע מקובל בשם F1. [7]  הם הראו כי ההפרש בין המדד שהתקבל לאלגוריתם גבוה ב-0.051 מהמדד הממוצע של ארבעת הרדיולוגים, וכי ההפרש הזה מובהק סטטיסטית (רווח הסמך להפרש ברמת סמך של 95% הוא 0.005-0.084).

החוקרים מודים כי למודל שלהם יש שלוש מגבלות, אך מציינים רק שתיים[8]. ראשית, הנתונים כללו רק צילומי חזה פרונטליים, בעוד שבכ-15% מהמקרים של דלקת ריאות יש צורך גם בתצלומי צד כדי לבצע אבחנה מדוייקת. שלישית[9] , החוקרים מודים כי העובדה שהמודל והחוקרים לא נעזרו בנתונים נוספים, כגון היסטוריה רפואית, פוגעת בביצועים של הרופאים (ושל המודל כמובן).

אוקדן-ריידר: אלגוריתמים הם מגניבים, אבל…

ד"ר אוקדן-ריינר אכן סבור כי נוכל להגיע למצב בו לאלגוריתם יהיו ביצועים שווים לביצועים של רופא אנושי ואף יעלו עליו. עם זאת, הוא טוען כי האלגוריתם של רג'פורקאר אינו מתאים לבצע אבחון רפואי. הסיבה לכך נעוצה, לדבריו, בנתונים של ואנג ועמיתיו, בהם רג'פורקאר ועמיתיו השתמשו לצורך פיתוח המודל.

אוקדן-ריינר טוען  כי יש בעייתיות בסיווגים של התצלומים בקובץ הנתונים המקורי של ואנג. לא ברור עד כמה הסיווגים מדוייקים, מה המשמעות הרפואית של הסיווגים, ועד כמה הסיווגים שימושיים לצרכים של ניתוח הצילומים. הוא מציין כי קובץ הנתונים והדוקומנטציה שלו עודכנו מספר פעמים מאז הפרסום המקורי. המאמר שמתאר את בניית הקובץ כמעט ואינו מתייחס להיבטים הקליניים של הנתונים, ומכיל רק פיסקה אחת שמתייחסת לרמת הדיוק של האבחונים שהותאמו לכל סט של תצלומים של חולה אחד.

עד כמה מדויקים הסיווגים? הם התקבלו בשיטות של text mining. הם לא התבוננו בתצלומים. אוקדן-ריינר טוען שרמת הדיוק של הסיווגים בקובץ אינה מספקת. הוא קבע זאת על ידי התבוננות בתצלומים. אמנם לא בכולם, אלא רק במדגם. הסיווגים שלו, כרדיולוג מומחה, היו שונים באופן מהותי מהסיווגים שבקובץ הנתונים.

השאלה השנייה היא מה המשמעות הרפואית/קלינית של הסיווגים. הנה הבעיה: הקביעה האם לחולה יש או אין דלקת ריאות היא קביעה קלינית. צילום רנטגן של החזה הוא נתון התומך באבחון (surrogate measure) ואינו מספיק לבדו לקבוע האם לחולה יש דלקת ריאות, או שה-"עננים" הנראים בצילום הם סימפטום לבעיה רפואית אחרת. המצב בו רואים "עננים" נקרא קונסולידציה. למעוניינים בהסבר רפואי מפורט יותר אני מפנה לפוסט אחר שלו. השורה התחתונה היא שהסיווג של ואנג ועמיתיו במקרה של "עננים" הוא סיווג של יש קונסולידציה או יש דלקת ריאות. אולם, מבחינה רדיולוגית קשה מאוד להחליט מתי קונסולידציה היא דלקת ריאות או משהו אחר. דלקת ריאות היא סוג של קונסולידציה. ההיפך לא נכון. כאשר ואנג ועמיתיו מציינים בנתונים שיש קונסולידציה, יכול להיות שלחולה יש דלקת ריאות. גם יכול להיות שלא. אוקן-ריינר טוען כי הנתונים שבדק מראים שהבעיה הזו קיימת.

וכאן עולה השאלה שלישית, והחשובה ביותר: אם הסיווגים של הנתונים בעייתיים, והמשמעות הקלינית שלהם מוטלת בספק, מה המודל באמת לומד? מה הערך של מודל המתבסס על נתונים בעייתיים?

מה הבעיה במאמר של רג'פורקאר?

אני סומך ב-100% על העבודה שעשו רג'פורקאר ועמיתיו. ההבנה שלי בתחום בו עוסקים היא בסיסית, ומבוססת בעיקר על לימוד עצמי. לצורך הדיון, אני מוכן להתעלם מהביקורת של אוקדן-ריידר על טיב הנתונים. זה לא משפיע על האיכות של המודל, שהרי התחרות בין ארבעת הרדיולוגים ובין המודל התבססה על אותם נתונים, והמודל ניצח. החוקרים מצאו כי במונחי F1, המודל היה יותר טוב מהרדיולוגים בשר ודם ב-0.051, וההבדל הזה מובהק סטטיסטית.

יש לי רק שאלה אחת: מה המשמעות הקלינית של ההבדל הזה? מה הערך המוסף הקליני של המודל? לצערי, אין לי מושג, ואני לא בטוח שלמישהו יש מושג. ברור שהשאלה הזו לא עלתה כלל על דעתם של החוקרים, כי אחרת הם היו לפחות מזכירים אותה  בדיון המסכם. המילה clinical הופיעה במאמר רק פעמיים, שתיהן בפרק המבוא. זהו אחד משבעת החטאים של הסטטיסטיקה: אי הבחנה בין תוצאה מובהקת לתוצאה משמעותית.

מה הבעיה המרכזית במודל של רג'פורקאר?

הבעיה המרכזית במודל של רג'פורקאר היא אבחון חלקי. כשהמודל קובע שלחולה אין דלקת ריאות, הוא לא אומר מה כן יש לו. כאן יש לרדיולוג יתרון ברור על המודל. יש לו ידע קליני שמאפשר לו לקבוע מה מצבו של החולה.

נכון שזה רק מודל, ואנחנו בתחילת הדרך. אין לי ספק שהמודל הזה הוא צעד בכיוון הנכון, אבל זהו צעד קטן מאוד. כדי נגיע למצב בו מודל כזה יהיה ראוי להישקל לשימוש, הוא יהיה צריך לסווג את תצלומי החזה ל-15 קטגוריות לפחות. מישהו יכול להעריך עד כמה אנחנו רחוקים ממודל כזה?

איך צריך להעריך את הביצועים של מודל רג'פורקאר? (וגם את ביצועי הרופא)

תסלחו לי, אבל אני לא מבין מה המשמעות האינטואיטיבית של מדד F1, ומה זה אומר אם הוא שווה ל-0.435. אני ביוסטטיסטיקאי. אחד מתפקידיי הוא לתקשר את התוצאות לצוות הקליני, כדי שהם יוכלו להעריך את המשמעות שלהם. כשהמטרה היא להעריך כלי דיאגנוסטי[10] אני בהחלט מציג בפניהם מדדים כמו accuracy, specificity, ו-sensitivity, למרות שבמקרים רבים גם להם אין משמעות אינטואיטיבית ברורה[11]. אבל כל המדדים האלה לא מספיקים. אלוהים נמצא בפרטים הקטנים, ולכן צריך להתעמק בהם.

מה יקרה אם המודל של רג'פורקאר ישמש ככלי אבחון עיקרי או יחיד למחלת ריאות? בואו נניח לצורך הדיון, כי המודל משמש כשלב הראשון בתהליך האבחוני, ויסווג את החולים כסובלים מדלקת ריאות, או לא סובלים מדלקת ריאות אלא ממשהו אחר, שהמודל לא יודע לזהות, ובמקרה כזה התהליך האבחוני יימשך. נניח גם כי זהו גם התהליך הרדיולוגי.

כאשר מודל או רדיולוג צופים בצילום חזה, יש ארבע אפשרויות.

קודם כל, יש מצב שבו המודל או הרדיולוג מאבחנים כי לחולה יש דלקת ריאות, ולחולה אכן יש באמת דלקת ריאות. זה מצויין. נותנים לחולה את הטיפול המתאים ושלום על ישראל. כאן יש תועלת.

ייתכן כי לחולה אין דלקת ריאות, והמודל או הרדיולוג יקבעו כי לחולה אין דלקת ריאות. זה אכן טוב, אבל לא יותר מדי טוב. החדשות הטובות הן שלא נעשה משהו רע. הבעיה היא שלא התקדמנו. אדם נשלח לביצוע צילום חזה כי הוא חולה במשהו. אם אין לו דלקת ריאות אז יש לו משהו אחר. מה? ובכן, יש צורך בבדיקות נוספות. כאן אין תועלת וגם אין נזק.

נמשיך. יכול להיות כי לחולה יש דלקת ריאות והמודל או הרדיולוג יקבעו כי אין לו דלקת ריאות. הרופאים ימשיכו בתהליך האבחוני. הטיפול בחולה מתעכב. כאן יש קצת נזק. במקרה הטוב, בחינה נוספת של הרופאים תעלה כי בכל זאת יש לו דלקת ריאות, והנזק מינימלי. במקרה הפחות טוב, אם כי לדעתי יותר נדיר, החולה יאובחן כסובל מבעיה אחרת, יקבל טיפול רפואי בלתי מתאים, יסבול מתופעות הלוואי והנזקים הבריאותיים שנגרמים מעצם הטיפול (ותמיד יש תופעות לוואי ונזקים בריאותיים), והבעיה הרפואית האמיתית שלו לא תטופל. עלול להיגרם נזק משמעותי.

ועכשיו נגיע למצב הגרוע ביותר: לחולה אין דלקת ריאות והמודל או הרדיולוג אומרים כי יש לו דלקת ריאות. החולה יקבל טיפול רפואי לדלקת ריאות, (אנטיביוטיקה, למשל) שאינו מתאים למצבו הרפואי, וכאמור לעיל, יסבול מתופעות הלוואי והנזקים הבריאותיים שנגרמים מעצם הטיפול (השגוי). שוב, החולה לא יקבל טיפול מתאים לבעיה הרפואית האמיתית שלו, שאינה דלקת ריאות, אלא ככל הנראה משהו יותר חמור. כאן נגרם נזק משמעותי. עד כמה הנזק משמעותי? זה כבר תלוי בהרבה גורמים, כמו למשל המצב הבריאותי האמיתי של החולה, ומשך הזמן שיעבור עד שיבחינו כי הטיפול הנוכחי שהחולה מקבל אינו יעיל ויבצעו הערכה מחדש של האבחון.

השאלה הגדולה היא: האם המודל והרדיולוג טועים את אותן הטעויות?

מדדים כגון F1 לא אומרים לנו מה השכיחות של כל מצב מארבעת המדדים שתיארתי, ובוודאי לא מספקים לנו הערכה של סך הנזק הפוטנציאלי, סך התועלת הצפויה, והערכה האם התועלת עולה על הנזק, ואם כן, עד כמה. אפשר לבצע את ההערכה הזו. אפשר לכנס צוות רופאים שיבחנו אחד לאחד את 389 התיקים ששימשו לבחינת המודל. סטטיסטיקאי טוב יוכל להקל עליהם את העבודה באמצעות הצגה בהירה של הנתונים. בסופו של דבר, תהיה לנו הערכה לגבי הביצועים הקליניים של המודל.

באותו אופן, אפשר להעריך את הביצועים הקליניים של ארבעת הרדיולוגים שהתחרו במודל.

כעת, נוכל לקבוע האם למודל יש באמת יתרון על הרופאים בשר ודם, ואם כן, האם היתרון משמעותי מבחינה קלינית.

הדיון בקבוצת הפייסבוק ותשובות לשאלות

חברי הקבוצה לא הקלו עלי את החיים כששיתפתי עימם את הפוסט של ד"ר הארווי, וטוב שכך. אני ציינתי שאני מסכים עם הטענות שלו, ומטבע הדברים היו חברים בקבוצה שלא הסכימו איתנו. הם העלו טיעונים טובים ושאלו אותי שאלות קשות ומצויינות. עניתי כמיטב יכולתי במסגרת המגבלות הטכניות של ממשק הפייסבוק. אביא כאן את עיקרי הדיון, אתייחס לשאלות שנשאלתי בכל הרצינות, ואענה כמיטב יכולתי. אם פיספסתי שאלה של מישהו, אנא הפנו את תשומת ליבי לכך ואתקן. אשמח גם להמשיך בדיון.

כמו כן, אני ממליץ לכם לקרוא את הדיון עצמו שכן מעבר לדיון הספציפי בטיעונים של ד"ר הארווי ולשאלות שנשאלתי נאמרו בו עוד דברים מעניינים וחשובים.

  • ערן פז טוען שאלגוריתמים יכולים ללמוד גם פעילויות אחרות שמבצע הרופא כולל אינטראקציה בין אישית, וחוזה בבדיחות הדעת כי גם באינטראקציה בין אישית ביצועי האלגוריתמים יהיו טובים יותר מאלה של הרופא. בסופו של דבר, אומר ערן, הרפואה תהיה אוטומטית כמעט לחלוטין.

האמת היא שאין לי מה לענות לטענה הזו. מדובר בהערכה סובייקטיבית. אני לא שולל את האפשרות שזה אכן יקרה[12], אבל יש לדעתי סיכוי הרבה יותר סביר שזה לא יקרה. בכל מקרה, אני משוכנע שהדור שלנו לא יזכה לראות את הרפואה האוטומטית, אם אכן החזון יתגשם. ההערכה הסובייקטיבית שלי היא כי זה לא יקרה בעתיד הנראה לעין.

  • ערן מתייחס גם לטיעון השני של ד"ר הארווי, ואומר כי זה נושא יותר פילוסופי/רגולטורי מאשר טכנולוגי, ובכך הוא צודק כמובן. הוא ממשיך וטוען כי הבעיה שגם אם המערכת היה טובה יותר מבן אדם, לנו כבני אדם קשה יותר לקבל טעות ספציפית שנעשתה ע"י מחשב, גם אם בסה"כ הוא טועה הרבה פחות מבן אדם.

לי יש בעיה עם האמירה הזו. המחשב לא טועה, גם לא המודל (או יותר נכון, האלגוריתם).[13] מקור הטעויות הן בפיתוח האלגוריתם.

  • כאן מתערב בדיון ים פלג ושואל מה אם יש רעש בדאטה.

התשובה המיידית שלי הייתה כי יש הבדל בין מודל שמנסה לחזות התנהגות של לקוח ובין מודל שעוסק בחיי אדם. עם זאת, ים בהחלט צודק. רעש בנתונים הוא בעיה שצריך להתמודד איתה. הדרך להתמודד, לדעתי, היא לבדוק את הביצועים הקליניים של המודל, כפי שהסברתי למעלה, ולהשוות אותו לביצועים של הרופאים, במונחים של סך תועלת מול סך נזק.

  • ים ממשיך ושואל האם סך התועלת הוא לא ההפרש בין ביצועי האלגוריתם לביצועי האדם.

עניתי מהמותן שלא, אבל אני מודה שהתשובה שלי לא הייתה מדוייקת. ים צודק עקרונית, אבל לקביעה שלו אין משמעות אם לא מגדירים היטב איך מודדים את ביצועי האלגוריתם וביצועי האדם. מי שקרא עד כאן יודע כבר שהתשובה הרבה יותר מסובכת, ו-F1 הוא לא המדד האולטימטיבי.

  • ים המשיך והקשה עלי. הוא טען כי אם יש לך אדם שמאבחן נכון X אנשים ומציל את חייהם ויש אלגוריתם שמאבחן נכון X+Y אנשים נכון (מהנתון שהוא יותר מדויק) ומציל את חייהם. יש לך Y יותר אנשים חיים.

זה כמובן נכון, אבל זה רק צד אחד של המטבע. מספר התוצאות החיוביות האמיתיות, או יותר מדוייק – שיעורן. ה-True Positive Rate הוא בהחלט מדד חשוב, אבל כפי שעניתי בקצרה בקבוצת הפייסבוק והסברתי כאן בפירוט, יש עוד צד למטבע, עוד שלושה צדדים למעשה. הבעיות העיקריות, כפי שהסברתי למעלה, נובעות מהאבחונים הלא נכונים: תוצאות חיוביות שגויות (False Positive) ותוצאות שליליות שגויות (False Negative).

  • ערן חוזר ושואל: בוא נניח לרגע שמודל לא יהיה יותר מדוייק, אלא יהיה יותר קרוב ל(1,1) על הROC או לכל מדד אחר שתבחר מבן אדם, עכשיו הטיעונים בסדר? כמו כן הוא מציין כי בדיון גם לא לקחנו בחשבון את העלויות של הקמת חוות GPU לעומת העלות של הכשרת רדיולוג, זה גם משפיע על התועלת?

אני טוען שבמצבים רפואיים התועלות והנזקים הם לא 0-1. נכון שאולי ב-ROC המודל יעשה טוב יותר, עם זה אני לא מתווכח. אני טוען שלטעויות שונות יש משמעויות שונות, וכמו כן, גם במצבים של חוסר טעות, TP ו-TN, עדיין יש משמעויות שונות. המצב נעשה הרבה יותר חמור אם עוברים מדלקת ריאות לסרטן, למשל. מי ייקח אחריות על חולה סרטן שלא יאובחן בזמן בגלל שהמודל היה רועש מדי?

  • אמיר רוזנפלד שואל: יהי המדד האולטימטיבי כפי שאתה מגדיר אותו. נניח שתחת מדד זה מכונה מתעלה על אדם. במי תבחר?

תשובתי היא שכשמדובר ברפואה אין דבר כזה "מדד אולטימטיבי". צריך לבצע הערכה כוללת של התועלת מול הנזק כי הנזקים עלולים להיות שונים מחולה לחולה. יש משמעויות לטעויות, והן שונות מחולה לחולה. חזרתי והבאתי את הדוגמה של חולה שמאובחן בטעות כחולה סרטן. הוא יקבל כימותרפיה שהוא לא צריך[14]. מילא התופעות לוואי של בחילות ונשירת שיער וכאלה – כימותרפיה גם גורמת נזקים בריאותיים ממשייים.

עם זאת, אני בהחלט מסכים שאם למודל יש יתרון קליני משמעותי על פני הרופאים בשר ודם, יש להעדיף את המודל, לפחות ברמה היישומית. עדיין יש לפתור את עניין האחריות.

  • ערן טוען כי אני סתם מתחמק מתשובה, ושואל: הנה, מודל, שעבור רמת הFP והFN של רופא נותן יותר TP מרופא אבל עדין טועה, מחליף את הרופא?

אני מודה שלא הבנתי את השאלה, אבל סבור שהבהרתי לחלוטין איך יש להעריך את הביצועים של המודל ולהשוות אותם לביצועים של הרופא.

סיכום

אני חושב שכולם מסכימים כי עדיין לא הגיע היום בו אלגוריתמים יכולים להחליף רופאים, אלא אם מדובר בתהליכים ממש פשוטים. למשל, אני סבור שאפשר להכניס לשימוש אלגוריתם שיקבל בתור קלט נתונים על חולה (כמו בדיקות דם, מדדי דופק ולחץ דם, וכולי) ויוציא התרעה לרופא המשפחה אם הנתונים בעייתיים. ייתכן ואלגוריתמים מסוג זה כבר קיימים ופועלים.

במקרים יותר ממוקדים, כמו אלגוריתם הפיענוח של רג'פורקאר הדברים הרבה יותר מסובכים. יש הסכמה כי הנתונים ששימשו ל-"אימון" המודל היו בעייתיים. אלגוריתם זה אמנם הראה יתרון מובהק סטטיסטית בביצועיו על פי מדד F1 לעומת ארבעה רופאים בשר ודם, אבל לא ברורה המשמעת הקלינית של יתרון זה (בלשון המעטה). כמו כן, האלגוריתם מוגבל בכך שבמקרה והוא מזהה כי לחולה אין דלקת ריאות, הוא לא מספק תובנה לגבי הבעיה האמיתית שיש לחולה. בסופו של דבר, האלגוריתם הזה הוא אמנם צעד בכיוון הנכון, אבל צעד זעיר מאוד, כמעט זניח.

יתר על כן, המקרה הרפואי של דלקת ריאות הוא קל יחסית מבחינה רפואית. מחלות אחרות, כגון סרטנים ומחלות לב, למשל, צופנות בחובן אתגרים הרבה יותר גדולים.

עם זאת, יש דרך טובה ויעילה לבחון האם הביצועים של אלגוריתמים כאלה עולים על הביצועים של רופא אנושי, ובכמה.

אבל הבעיה העיקרית אינה טכנולוגית אלא אתית.

מי אחראי במקרה שהאלגוריתם טועה? מספר הדעות יהיה כנראה כמספר המשיבים.

בואו נראה מה יכול לקרות בארצות הברית, מכיוון שסביר להניח כי היא תהיה בין המדינות הראשונות בהן יוכנסו אלגוריתמים כאלה לשימוש (בהנחה שבכלל יוכנסו). במדינה בה תביעות על רשלנות רפואית[15] נפוצות מאוד, הנפגעים לא יהססו לתבוע את החברה שמיישמת את האלגוריתמים, את בעלי הפטנט, ומי יודע את מי עוד. האם חברות הביטוח יסכימו לבטח את החברה שמיישמת את האלגוריתם? איש אינו יודע.

אני רוצה להרחיב את הדיון בשאלת האחריות, כי זו לדעתי השאלה המהותית, וממנה נגזרה הכותרת הפרובוקטיבית של הרשימה הזו.

בואו ניקח, כדוגמה פשוטה ביותר, אלגוריתם שצריך לזהות האם בתמונה שמוצגת לו יש חתול. לאף אחד לא איכפת באמת אם האלגוריתם יטען שתמונה של כלב מראה לדעתו חתול.

מה עם אלגוריתם שמחליט אם כדאי להציע לאדם שנכנס לאתר אינטרנט עיסקת קניה מסויימת? יכול להיות שאנשים שהעיסקה תוצע להם לא יבצעו את הקניה, וגם יכול להיות שיפוספסו קונים שהיו מבצעים את הרכישה אם העיסקה הייתה מוצעת. זה חבל, אבל בסך הכל מדובר פה בכסף.

אם מדובר בהרבה כסף, הבעיות יכולות להיות גדולות. בנקים שמנסים לזהות איזה לקוח עלול לא להחזיר את ההלוואה שיקבל עלולים לעמוד בפני בעיה אם האלגוריתם לא מספיק טוב. עם זאת, אני יודע שאלגוריתמים כאלה פועלים, וכנראה שיקול הדעת שלהם יותר טוב משיקול הדעת של הפקיד.

בואו נמשיך. מה עם אלגוריתם שמחליט על ביצוע עיסקות קניה ומכירה בבורסה? בסרט הזה כבר היינו בשנת 2008. אני מקווה שהאלגוריתמים האלה השתפרו מאז, כי לא מתאים לי עוד משבר כלכלי עולמי.

מה בקשר למכונית אוטונומית? כאן כבר מתחילים לדבר על חיי אדם. מישהו יודע כמה טעויות שליליות שגויות (False Negative) יש לאלגוריתם של מובילאיי? וכמה מהטעויות האלה מובילות לתאונות? וכמה מהתאונות האלה כוללות פגיעות בגוף? אני לא יודע. אני לא בטוח שיש מי שיודע.

נכון, מכוניות אוטונומיות כבר נוסעות בכל מיני מקומות בארצות הברית, במסגרת ניסויים לבחינת האלגוריתמים. מי יעריך את מאזן התועלת מול הנזק של האלגוריתמים שמפעילים את המכוניות האלה וישווה אותם לביצועים של נהג אנושי? ואיך? האם יהיה רגולטור, כמו שיש את ה-FDA בתחום הרפואי? האם חברות הביטוח יסכימו לבטח את המכוניות והאלה והנוסעים בהם? ואם כן, מה תהיה עלות הביטוח?

מה בקשר למטוס אוטונומי? מי מוכן לעלות על טיסה טרנס אטלנטית במטוס ללא טייס?

אני יודע שאי אפשר לעצור את הקידמה, ובניגוד למה שעלולים לחשוב אני בעד הקידמה. אני בהחלט חושב שעתיד בו אלגוריתם יוכל להחליף רופא ולבצע את מלאכתו באופן טוב יותר מהרופא האנושי, וכולנו ניסע במכוניות אוטונומיות, הוא עתיד טוב. אבל כדי להגיע לעתיד הזה עלינו להתגבר על הרבה מאוד בעיות, והבעיות הטכנולוגיות הרבה יותר פשוטות מהבעיות האתיות. אני גם חושב שהעתיד הזה רחוק מאוד מאיתנו ואנו לא נזכה לראות אותו, וגם לא בנינו ובני בנינו.


הערות
  1. עם זאת, לא אתייחס לטענה "תן תמונה היום לעשרה רדיולוגים ותקבל 11 חוות דעת" []
  2. שכן הוא לא התייחס אליו []
  3. כגון תצלומי רנטגן, סריקות CT ו-MRI, ועוד []
  4. כלומר, באופן רנדומלי []
  5. שזה תיאור מרשים לתהליך של אמידת פרמטרים []
  6. אעיר ואומר כי יש כאן בעיה מסויימת – נתוני הבדיקה שונים באופן מהותי מנתוני האימון והתיקוף. []
  7. זהו הממוצע ההרמוני של הרגישות – recall ושל הדיוק – precision. ראו הגדרות בויקיפדיה []
  8. השלישית ירדה בכביסה? יותר סביר להניח כי אחרי מחשבה נוספת הם הגיעו למסקנה כי המגבלה הנוספת שחשבו עליה אינה באמת מגבלה []
  9. או בעצם שנית, לא משנה []
  10. כמו בדיקת דם חדשה, או אלגוריתם מגניב שפיתחו החבר'ה בסטנפורד []
  11. יש מחקרים שמראים כי הרבה רופאים מפרשים אותם באופן לא נכון, אבל לא ניכנס לזה עכשיו []
  12. כלומר, אני סבור כי ההסתברות לכך גדולה מאפס []
  13. מכאן הגיעה הכותרת הצינית והפרובוקטיבית של הפוסט הזה []
  14. או אפילו יעבור ניתוח מיותר []
  15. ובארצות הברית גם טעות בתום לב נחשבת כרשלנות []