היסטוריה | נסיכת המדעים

ארכיב עבור תגית היסטוריה

הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל

"כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה, משום שזהו כלי המדידה של כוונותיו" – פלורנס נייטינגייל

אני מניח שבסביבתכם הקרובה החגיגות לא מורגשות במיוחד, ובכל זאת, היום מצויין ברחבי העולם יום האחים והאחיות הבינלאומי. אל תרוצו לקנות מתנה לאחותכם הגדולה – מדובר כאן בהוקרה בינלאומית למקצוע הסיעוד. התאריך לא נבחר במקרה – ה-12 במאי הוא יום הולדתה של פלורנס נייטינגייל – הידועה בעיקר בזכות התרומה שתרמה להתפתחות מקצוע הסיעוד והפיכתו לדיסציפלינה מודרנית. פחות ידועה תרומתה של נייטינגייל לתחום הסטטיסטיקה. פלורנס נייטינגייל נמנית על חלוצי הסטטיסטיקה המודרנית.

פלורנס נייטינגייל נקראה על שם העיר פירנצה (פלורנס) באיטליה, שם נולדה היום לפני 186 שנה (12 למאי 1820), במהלך טיול באירופה שערכו הוריה. אביה, איש אצולה שלמד בקיימברידג´, נטל על עצמו להיות המורה הפרטי של פלורנס ושל אחותה הבכורה. השיעורים כללו לימוד יצירות קלאסיות, הפילוסופיה של אריסטו ואויקלידס, תנ"ך ופוליטיקה. בהיותה בת עשרים ביקשה מהוריה רשות ללמוד מתמטיקה, אך אמה התנגדה לכך, ואביה הציע כי תלמד תחום המתאים יותר לנשים, לדעתו. לאחר מאבקים הסכימו לבסוף, ונייטינגל החלה ללמוד מתמטיקה בהדרכתו של המתמטיקאי גוז´ף סילבסטר. היא גם עסקה בהוראת מתמטיקה לילדים.

Nightengale

נייטינגל התעניינה גם בנושאים חברתיים, וב-1845 החליטה לעסוק גם בטיפול בחולים כאחות, למרות שלא היה לה כל רקע בנושא. הוריה שוב התנגדו, שכן מקצוע זה לא נחשב למכובד באותם הימים. אך ב-1849 סיירה עם ידידים במצרים, ושם ביקרה במספר בתי חולים. ב-1850 החלה ללמוד בבית ספר לאחיות באלכסנדריה. ב-1853 חזרה ללונדון, והחלה לעבוד בהתנדבות באחד מבתי החולים שבעיר. כעבור שנה, כאשר הכריזה בריטניה מלחמה על רוסיה, התייצבה נייטינגייל יחד עם עוד 38 אחיות בקונסטנטינופול, ולמעשה כפתה על הצבא הבריטי להיעזר בשירותן בבתי חולים צבאיים. היא הנהיגה מספר רפורמות רפורמות בניהול בתי החולים, שהחשובה ביניהן היא שמירה על רמת סניטציה נאותה.

כדי להראות את חשיבות השמירה על רמת הסניטציה, נייטינגייל אספה בקפדנות נתונים סטטיסטיים אודות שיעורי התמותה בבתי החולים השונים. היא ניצלה את ידיעותיה במתמטיקה כדי להראות כי שיעור התמותה צנח מיידית עקב הנהגת הסניטציה מ-80% ל-47%, ובמשך הזמן הלך וירד עד לשיעור של 2.2% בלבד. "כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה", אמרה נייטינגייל, "משום שזהו כלי המדידה של כוונותיו".

נייטינגייל גם פיתחה שיטות גרפיות להצגת הנתונים. הנה דיאגרמת "קוטב-שטח" (polar area) ששירטטה:

הדיאגרמה מזכירה לכם את דיאגרמות העוגה המפורסמות – הלא כן? אולם הדיאגרמה הזו מתוחכמת בהרבה. נייטינגייל משלבת כאן מספר רעיונות. כל גזרה מייצגת קטגוריה של נתונים (בתי חולים במקרה הזה). אורך הגזרה (המרחק מהמרכז) מייצג שכיחות, וכל גזרה מחולקת בנוסף לכך לשלושה חלקים בשלושה צבעים (הדיאגרמה המקורית הייתה צבעונית) המייצגים סיבות תמותה. שטח הגזרות מבטא את השונות של התצפיות. כל זאת בשתי נקודות זמן. מדיאגרמה זו התפתחה בהמשך דיאגרמת העוגה הפשוטה יותר, וגם ההיסטוגרמה – בה השטח מבטא שכיחות.

כאשר חזרה ללונדון עם סיום מלחמת קרים ב-1856, המשיכה לאסוף נתונים על שיעורי התמותה בבתי החולים הצבאיים, כדי לקדם את שיטות הניהול שפיתחה. מאמציה נשאו פרי, ובהוראת המלכה ויקטוריה הוצאו המלצותיה לפועל. ב-1857 הייתה לאשה הראשונה שנבחרה אי פעם לחברה הסטטיסטית המלכותית בזכות תרומתה בתחום הסטטיסטיקה הרפואית. היא הוזמנה לייעץ לממשלות קנדה וארצות הברית בתחומים אלה. כמו כן, פתחה בית ספר לאחיות משל עצמה, בו נלמד מקצוע האח/ות על פי העקרונות והסטנדרטים החדשים שקבעה. כמו כן פרסמה למעלה מ-200 ספרים ומאמרים בנושאי סיעוד וסטטיטיקה רפואית. ב-1874 נבחרה לחברת כבוד באיגוד האמריקני לסטטיסטיקה. כמו כן הוענקו לה שני תארי אצולה, מידי המלכה ויקטוריה ב-1883 ומידי המלך אדוארד השביעי ב-1907. היא נפטרה ב-13 לאוגוסט 1910 בגיל 90.

רשימה זו מבוססת על מאמר שפירסמתי בפורום המתמטיקה של תפוז.

פורסם לראשונה באתר "רשימות" בתאריך 12 במאי 2006 שם התקבלו 2 תגובות

yoni בתאריך 5/17/2006 11:56:47 PM

מדהים

לא יאומן כמה רחבי אופקים היו אנשים בעולם ללא תקשורת ואינפומציה חופשית. תודה על המאמר

שרונה בתאריך 5/6/2008 10:47:12 AM

תודה על האינפורמציה

אני אחות במקצועי ומאד הופתעתי לראות שפלורנס נייטינגל ניחנה בעוד כשרונות כמו סטטיסטיקה וניתוח מספרים. בתור אחות שמקווה לערוך מחקרים בעתיד זה רק מעודד ונותן דוגמא טובה ולכן תודה לך, שרונה

נשלח: 4 בדצמבר, 2008. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, ויזואליזציה, נשים בסטטיסטיקה.
תגובות: 3 | טראקבק

פרס נובל למתמטיקה

זכייתו של המתמטיקאי הישראלי פרופ' ישראל אומן בפרס נובל לכלכלה העלתה שוב את סוגיית אי קיומו של פרס נובל למתמטיקה. האגדות האורבניות בנושא זה רבות. למשל, נטען כי המתמטיקאי הצרפתי אוגוסטין קושי היה המאהב של הגברת נובל, ולכן נובל לא הקצה פרס למתמטיקה כדי שהלה לא יזכה בפרס. סיפור יפה, אלא שנובל לא היה נשוי, וקושי הלך לעולמו כאשר אלפרד נובל היה בן שנתיים בלבד.

פרס נובל למתמטיקה אין, אבל פרס נובל למתמטיקאים יש ויש. באופן טבעי, מספרם של המתמטיקאים שזכו בפרס לכלכלה גבוה למדי, ובין הזוכים הבולטים היו המתמטיקאים ג'ון נאש וקנת ארו. אולם, המדקדקים יטענו כי פרס נובל לכלכלה אינו פרס נובל אמיתי אלא פרס על שם נובל. נו, טוב.

גם בין הזוכים בפרס נובל לפיזיקה ישנם מתמטיקאים רבים, כיוון למעשה אין אפשרות לעסוק בפיזיקה ברמה גבוהה ללא השכלה מתמטית ראויה, והעוסקים בפיזיקה תיאורטית זקוקים לפתח עבור עצמם כלים מתמטיים חדשניים. בין הזוכים הבולטים בקטגוריה זו ניתן למנות את אלברט איינשטיין, פול דיראק וריצ'רד פיינמן.

אולם, חיפושי העלו כי ארבעה מתמטיקאים זכו בפרסי נובל שאינם בתחומי הכלכלה או הפיזיקה. שניים זכו בפרס לספרות, ושניים בפרס לכימיה. ברשימה זו אסקור אותם ואת פועלם.

ארבעה מתמטיקאים שזכו בפרס נובל. משמאל לימין: חוזה אצ'גאראי (ספרות, 1904), ברטראנד ראסל (ספרות, 1950), הרברט האופטמן (כימיה, 1985), ג'ון פופל (כימיה, 1998).

המתמטיקאי הראשון שזכה בפרס נובל היה הספרדי חוזה אצ'גאראי. אצ'גאראי, בן העם הבאסקי, נולד במדריד בשנת 1832. הוא בלט כבר בגיל צעיר בכשרונו המתמטי, ובגיל 21 התמנה כפרופסור למתמטיקה באוניברסיטה של מדריד. בנוסף לעיסוקו במתמטיקה הקדיש מזמנו גם למחקר בכלכלה, ופעל לקידום הסחר הבינלאומי של ספרד. עם ביטול המלוכה בספרד במהפכה של שנת 1868, פרש ממשרתו האקדמית והתמנה לתפקיד שר האוצר והחינוך בממשלת ספרד. עם החזרת המלוכה בשנת 1874, פרש מהחיים הפוליטיים, ופתח בקריירה חדשה כסופר ומחזאי, שהניבה שורה של מחזות סאטיריים מצליחים שהוצגו ברחבי אירופה בסוף המאה ה-19. מחזות אלה זיכו אותו בפרס נובל לספרות, שהוענק לו ב-1904. האם כישוריו המתמטיים של אצ'גאראי הועילו לו בקריירה הספרותית שלו? ייתכן. חוקרי ספרות משבחים את המבנה הקפדני של מחזותיו. סביר יותר להניח כי הוא היה אדם מוכשר מאוד, שהצליח בכל אשר שלח ידו.

מתמטיקאי נוסף זכה בפרס נובל לספרות 46 שנה לאחר מכן – זהו ברטאנד ראסל, שהפרס הוענק לו ב-1950. ועדת הפרס מציינת כי הפרס הוענק לו עבור כתביו המהווים "ניצחון לאידיאלים האנושיים ולחופש המחשבה". בין כתבים אלה מוזכרים "יסודות הגיאומטריה" (1897), "סקירה ביקורתית של הפילוסופיה של לייבניץ" (1900), "יסודות המתמטיקה" – היצירה המונומנטלית שכתב יחד עם וייטהד בין 1910 ל-1913 "מבוא לפילוסופיה מתמטית" (1919), ומספר ספרים שעוסקים בלוגיקה, יחד עם עוד כתבים רבים בתחומים רבים נוספים. ברטראנד ראסל ללא ספק זכה בפרס בזכות עבודתו המתמטית.

ב-1985 זכה מתמטיקאי נוסף בפגישה עם מלך שוודיה. הרברט א. האופטמן, ד"ר למתמטיקה שעבד במכון למחקר רפואי בעיר בפאלו, ניו-יורק, זכה בפרס במשותף עם חברו ללימודים, הכימאי ג'רום קארל. השניים פיתחו יחדיו אלגוריתם ששילב שיטות גיאומטריות והסתברותיות, שבעזרתו ניתן לקבוע את המבנה המולקולרי של חומרים תוך שימוש בקרני רנטגן. שיטה זו, כאשר יושמה בשנות השמונים באמצעות מחשב, קיצרה את משך הזמן שנצרך לקביעת המבנה המולקולרי של מולקולה ביולוגית פשוטה משנתיים ליומיים. כך ניתן היה לקבוע את המבנה המולקולרי התלת מימדי של ויטמינים, הורמונים וחומרים אנטיביוטיים בקלות, ובעזרת הידע שהתגלה ניתן היה להמשיך לפיתוח תרופות חדשות.

בשנת 1998 זכה בפרס נובל לכימיה מתמטיקאי נוסף, ג'ון א. פופל. גם פופל זכה בפרס עבור פיתוח שיטות חישוביות חדשות, בתחום הכימיה הקוואנטית. פופל חיפש ומצא שיטות לפתרון משוואות שרדינגר, המשוואות היסודיות של תורת הקוואנטים. משוואות אלה נחשבו קודם לכן לבלתי פתירות, פרט למספר מקרים פרטיים פשוטים. התכנה שפיתח ליישום שיטותיו נושאת את השם המחייב "גאוסיאן", ומשמשת כיום ככלי עבודה בסיסי של כל כימאי.

פורסם לראשונה באתר "רשימות" בתאריך 11 באוקטובר 2005 שם התקבלו 4 תגובות

יעקב בתאריך 10/13/2005 1:09:12 PM

מעניין מאוד

תודה.

חן שפירא בתאריך 10/14/2005 8:42:27 PM

נהדר

השכלתי והחכמתי.
המון תודה!

שי פישר [אתר] בתאריך 10/16/2005 11:14:47 AM

ללא כותרת

מדוע אין פרס נובל למתמטיקה?

שרון קנובליך בתאריך 12/16/2007 2:52:37 PM

אין פרס נובל מכייון ש..

אין פרס נובל למתמטיקה מכיוון שאישתו של אלפרד נובל בגדה בו עם מתמטיקאי.

נשלח: 3 בדצמבר, 2008. נושאים: היסטוריה, מדע.
תגובות: אין | טראקבק

שני ספרים על צפנים

code war את "מלחמת הצפנים" קראתי בפעם הראשונה בערך בכיתה ח, זמן קצר אחרי שהספר יצא לאור והגיע נוצץ ומבריק אל הספריה העירונית. הייתי אז תלמיד טוב במתמטיקה, אבל ודאי שלא חשבתי על מתמטיקה כמקצוע, ודאי לא על סטטיסטיקה. את הספר לקחתי כי הוא הבטיח סיפורי ריגול מרגשים, וכמובן, תיאור מלחמת המוחות בין מומחי הצופן והמודיעין של הצדדים הנלחמים.

מבחינה מתמטית, אין הרבה בספר. יש תיאור של מספר שיטות הצפנה, רובן שיטות של החלפה למינהן, וכן את שיטת הרשת של קארדנו. באשר לפיצוח צפנים, הספר עוסק בנושא בקצרה, ורק מזכיר כי המפתח לפיצוח צפנים נמצא בניתוח סטטיסטי של טקסטים מוצפנים.

בולטים בחסרונם בספר שני נושאים מרכזיים בתחום ההצפנה: צופן RSA שעדיין לא הומצא בשעת כתיבת הספר (שיצא לאור לראשונה ב-1973), וכן סיפור הפיצוח של צופן האניגמה בו השתמשה גרמניה הנאצית, שפרטיו עדיין היו סודיים יותר בתחילת שנות השבעים של המאה העשרים. לכן גם שמו של אלן טיורינג נעדר מהספר.

למרות חסרונות אלה, הספר מעניין ומרתק, וכשנתקלתי בו שוב בספריה לפני זמן מה, לא היססתי ולקחתי אותו מייד לקריאה חוזרת, ועלי לומר שלא התאכזבתי, למרות שכעת היה עלי להשוות אותו ל"סודות ההצפנה", שכן, כפי שהסברתי, ההשוואה בין הספרים אינה הוגנת.

sodot_hahatzpana "סודות ההצפנה" אכן עולה על "מלחמת הצפנים" בכמה דרגות. השיטות בסיסיות לפענוח צפנים מוסברות באופן מפורט למדי. נושא פיצוח האניגמה על ידי טיורינג וצוותו נסקר בהרחבה. הבעיות הכרוכות בהצפנה יעילה ובטוחה הוסברו בלשון פשוטה, וכן מוספר בפירוט כיצד הובילו הנסיונות לפתור את הבעיות האלה להמצאת אלגוריתם RSA. פרק מרתק נוסף בספר מתאר כיצד שיטות קלאסיות לפיצוח צפנים סייעו לארכיאולוגיים בפענוח של שפות עתיקות, ככתבי היתדות למינהם, וכמובן – כתב החרטומים.
* "מלחמת הצפנים" מאת ברוס נורמן, הוצאת מערכות, 1978.
* "סודות ההצפנה" מאת סיימון סינג, הוצאת ידיעות אחרונות, 2003.

פורסם לראשונה באתר "רשימות" בתאריך 12 בספטמבר 2005 שם התקבלה תגובה אחת

יניב בתאריך 9/13/2005 4:36:27 PM

סודות ההצפנה יצא להורדה – חוקית

http://www.sunsite.org.uk/package/simonsingh-codebook

נשלח: 3 בדצמבר, 2008. נושאים: הממ... מעניין..., ספרים וסרטים.
תגובות: אין | טראקבק

למי צלצל הפעמון?

במצפה הכוכבים שבגטינגן ישב קרל פרידיריך גאוס ועמל על חישוב מסלוליהם של גרמי השמיים. גאוס, גדול המתמטיקאים של המאה ה-17 (ואולי גדול המתמטיקאים אי פעם), היה מודע לטעויות המדידה של תצפיותיו. הוא הבחין כי להתפלגות של הטעויות המצטברות יש צורה פעמונית – רוב הטעויות מתרכזות סביב ערך מרכזי, אבל לעיתים ערכי הטעויות מצטברים לסכום גבוה או נמוך במיוחד. גאוס הצליח למצוא את הנוסחה המתמטית המאפיינת את ההתפלגות הפעמונית הזו ופרסם אותה במאמר בשנת 1809. אבל האם הבחין כי מדובר בחוק כללי הניתן ליישום גם לגבי תופעות אחרות? ייתכן שכן, אך הוא לא טרח לתעד זאת.

אברהם דה-מואבר - הראשון שהוכיח את קיומו של הגבול המרכזי

אברהם דה-מואבר, צרפתי הוגנוטי שגלה לאנגליה בסוף המאה ה-17, לא הצליח למצוא משרה אקדמית בארצו החדשה, ולכן נאלץ לעסוק בהוראה פרטית ובייעוץ למהמרים. הוא חקר את פרופורציית ההצלחות בסדרות של הימורים, וגילה כי להתפלגות הפרופורציות יש צורה פעמונית – בדרך כלל פרופורציית הזכיות קרובה לסיכוי הזכיה בהימור, אך לעתים פרופורציית הזכיות גבוהה במיוחד או נמוכה במיוחד. דה-מואבר הצליח למצוא את הנוסחה המתמטית המאפיינת את ההתפלגות הפעמונית הזו, ואף הוכיח כי כאשר מספר ההימורים גדל, הולכת ההתפלגות ומתקרבת אל הנוסחה התיאורטית. הוא פרסם תוצאה זו בספר שהופיע בשנת 1718. למרבה הצער, ספרו של המתמטיקאי האלמוני לא היה לרב מכר, למרות שהופיע במספר מהדורות.

פייר סימון לפלס לא היה מתמטיקאי אלמוני כלל וכלל כאשר הופיע ספרו "התיאוריה האנליטית של ההסתברות" בשנת 1812. לפלס התעניין גם בהימורים וגם בתנועות הכוכבים, ולכן הכיר גם את עבודתו של גאוס בנושא, וגם את המשפט של דה-מואבר. לכן הבחין לפלס בקשר בין שתי העבודות, ויצר מהן משפט חדש – משפט הגבול המרכזי. עבודתו של לפלס הושלמה על ידי מתמטיקאים שבאו אחריו – פואסון, צ'ביצ'ב, מרקוב, ליאפונוב, לינדברג, פלר ולוי – כולם תרמו לניסוח ההוכחה המדוייקת של משפט זה.

על פי משפט הגבול המרכזי (בניסוח רשלני) – ההתפלגות של ממוצע תצפיות מקריות ובלתי תלויות שואפת לגבול מרכזי – וגבול זה הוא ההתפלגות הפעמונית המפורסמת. התפלגות זו ידועה בגרמניה בשם "התפלגות גאוסיאנית", בצרפת בשם "התפלגות לפלס" ובכל מקום אחר בשם "ההתפלגות הנורמלית". גרמניה הביעה את הערכתה לגאוס כאשר הדפיסה את דיוקנו על השטר של 10 מרק (שכבר אינו בשימוש). על השטר ניתן לראות את הפעמון המפורסם של העקומה הנורמלית ואת הנוסחה המתמטית המאפיינת אותה.

המשפט הזה מקל עד מאוד את חייהם של הסטטיסטיקאים – במקרים רבים מאוד אין צורך לחשב הסתברויות מדוייקות – כיוון שעל ידי שימוש במשפט ניתן לערוך חישוב מקורב שהינו מדוייק דיו לכל צורך מעשי. שיטתו של גאוס להערכת שגיאות המדידה (שהוזכרה בראשית רשימה זו) משמשת עד היום כל חוקר במדעי הטבע והחברה – פשוט אין בנמצא שיטה טובה ממנה (על כך אכתוב ברשימה אחרת) ועקרונות המשפט המקורי שניסח דה-מואבר עומדים ביסודותיהם של כל סקרי הדגימה ומספקים פרנסה לכל מכוני הסקרי למינהם.

פורסם לראשונה באתר "רשימות" בתאריך 11 בספטמבר 2005

נשלח: 3 בדצמבר, 2008. נושאים: המשפטים הגדולים של הסטטיסטיקה.
תגובות: 1 | טראקבק

חוק המספרים הגדולים

בית קזינו מוכן להכפיל את כספו של כל מי שינחש נכונה את הצבע שיעלה בסיבוב הבא של גלגל הרולטה – שחור או אדום. חברות ביטוח משפות את לקוחותיהן על הנזקים שנגרמו להם. סטטיסטיקאי מודיע על תוצאת הבחירות מייד לאחר סגירת הקלפיות, ורשויות הבריאות מאשרות תרופות חדשות לשימוש (ולפעמים גם מורות על הפסקת השימוש בתרופות מסוימות). קבוצת ספורט מחליטה לחתום על חוזה שמן עם שחקן כוכב. כל אלה הם שימושים של חוק המספרים הגדולים.

מבין המשפטים הגדולים של הסטטיסטיקה – חוק המספרים הגדולים הוא ככל הנראה הבסיסי ביותר. ניסוח מעט רשלני של החוק אומר כי אם אתה צופה בסדרה אינסופית של תצפיות מקריות שאינן תלויות זו בזו, אשר כולן מתארות את אותה התופעה, אזי ממוצע הסדרה ילך ויתקרב לערך קבוע. ערך זה הוא התוחלת של התופעה המקרית הנצפית.

למתמטיקאים יש ניסוחים מדויקים לטענה הזו, וכמובן שגם הוכחה. המתמטיקאי השוויצי יעקב ברנולי הוכיח את הגרסה הראשונה של החוק בסוף המאה ה-17, וגרסאות מורחבות וחזקות יותר שלו הוכחו מאוחר יותר.

יעקב ברנולי הונצח על בול שוויצי. ברקע הניסוח המתמטי של חוק המספרים הגדולים, אותו הוכיח ברנולי לפני יותר מ-300 שנה, ותיאור גרפי של החוק.

מדוע החוק הזה חשוב כל כך? אנסה להסביר זאת באמצעות דוגמא פשוטה יחסית – גלגל הרולטה.

גלגל הרולטה בקזינו של מונטה קרלו מחולק ל-37 גזרות שוות, ועל כל גזרה רשום אחד מבין המספרים 0, 1,2,… ועד 36. 18 מבין המספרים מסומנים בצבע אדום, 18 בשחור, ואילו המספר אפס מסומן בצבע ירוק. ההימור הפשוט ביותר מאפשר לך לבחור את אחד הצבעים, אדום או שחור. אם הימרת על סכום של יורו אחד כי בסיבוב הבא של הרולטה יעלה מספר המסומן באדום, ואכן כך קרה, היורו שלך יוחזר לך יחד עם יורו נוסף בו זכית. אם לא עלה בגורל מספר "אדום"… אתה יכול לנסות שוב את מזלך.

אם הסיכויים של כל המספרים לעלות בגורל שווים, הרי שהסיכוי כי יעלה בגורל מספר מסויים (7, למשל) הוא 1/37. הסיכוי כי יעלה מספר אדום בגורל הוא לכן 18/37, והסיכוי כי יעלה מספר שאינו אדום בגורל הוא 19/37. גם בהימור על שחור הסיכויים לזכות הם 18/37 ולהפסיד – 19/37. כלומר, בכל הימור על אדום/שחור הסיכוי לזכיה הוא 18/37 והסיכוי להפסד הוא 19/37.

roulette אבל כל זה רק תיאוריה – תיאוריה המבוססת על מודל הסתברותי. האם התיאוריה עומדת במבחן המציאות? דרך אפשרית לבחון את התיאוריה היא לנסות אותה במציאות. הבה נבצע המון (אבל ממש המון) סיבובים של גלגל הרולטה, ונבדוק מהי פרופורציית הפעמים בהן עלה בגורל מספר "אדום" מתוך כלל הסיבובים. נשמע הגיוני.

אבל ההגיון של מתמטיקאים מוזר למדי. כדי שהניסוי המוצע יניח את דעתם, עליו להסתמך על משפט מתמטי כלשהו. חוק המספרים הגדולים מקשר בין המודל ההסתברותי – ובין הניסוי הסטטיסטי, ולכן מהווה את הבסיס המתמטי לניסוי הזה. אם המודל המתמטי אכן מתאר נכונה את התנהגות גלגל הרולטה, אז חוק המספרים הגדולים אומר כי פרופורציית הפעמים בהן יעלה בגורל מספר "אדום" תהיה בקירוב 18/37.

ומה יוצא לקזינו מכל זה? כסף, הרבה כסף. ב-18/37 (או 48.6%) מההימורים יפסיד הקזינו יורו, וב-51.4% מההימורים ירוויח הקזינו יורו. הרווח הממוצע להימור כזה הוא לכן 0.027 יורו להימור. אבל אם סך כל ההימורים האלה בערב אחד הוא 100,000 יורו (סתם זרקתי מספר) הרווח מהימור פשוט כזה הוא כ-2700 יורו. לא רע. כמובן שיש הימורים בהם הסיכויים של המהמר להרוויח נמוכים יותר (וסיכויי הקזינו לזכות גבוהים יותר), ואז גם הרווח של הקזינו גדל בהתאם. תראו את הרווחים של חברות הביטוח.

כשמשתמשים בחוק המספרים הגדולים – חשוב מאוד להיות מודעים למגבלות שלו. הבה ונראה מה עלול לקרות אם לא עושים זאת.

קודם כל, רצוי מאוד כי התנאים של המשפט יתקיימו. אם שחקן כדורסל קולע בממוצע 30 נקודות למשחק במשך 5 עונות בהן שיחק כ-450 משחקים, זה באמת הישג ראוי לציון. אבל לפני שתחתימו את הכוכב על חוזה שמן, עצרו וחשבו: האם באמת אנו צופים בסדרה של תצפיות בלתי תלויות? (הדעות חלוקות). האם הסדרה תימשך עד אינסוף? סביר להניח שלא.

גם אם התנאים של המשפט מתקיימים, איזה מודל הסתברותי משקפות התצפיות? אם המודל שלכם הוא לא המודל הנכון, אתם עלולים למצוא את עצמכם מכריזים על ניצחון בבחירות של מועמד שדווקא הפסיד, כמו שלמשל קרה לעיתון ה-Literary Digest ב-1936.

גם אם תנאי המשפט מתקיימים, והמודל הוא המודל נכון, יש עוד בעיה קטנה. המשפט מדבר על התנהגות סדרת התצפיות באינסוף. באופן מעשי, אפשר להסתפק במספר סופי של תצפיות, אם המספר הזה מספיק גדול. זהו "גודל המדגם" המפורסם. מהו מדגם גדול מספיק? תנו לי מספר, ואתן לכם דוגמא בה המספר הזה אינו מהווה גודל מדגם מספיק גדול. חוק המספרים הגדולים אינו אומר דבר על "קצב ההתכנסות" של סדרת הממוצעים. לכן כדי לקבוע את גודל המדגם יש להשתמש בכלים אחרים, ועל כך אכתוב ברשימה אחרת.

פורסם לראשונה באתר "רשימות" בתאריך 19 ביולי 2005 23:07 שם התקבלו 8 תגובות

גילי נחום בתאריך 7/20/2005 12:39:52 AM

מעניין מאוד

עוד לפני כמה שנים חשבתי להרוויח 200 דולר ללילה בעזרת הטכניקה הבאה:
(נניח שההימור הוא הוגן p=0.5)
להמר 200 דולר, אם הרווחתי אז לסגור את הבסטה וללכת לבית שמח ומאושר, במידה והפדסתי אז אהמר שוב בסכום הנדרש לזכות ב- 400 דולר (בכדי לכסות על ה- 200 הפסד ולהרוויח 200) אם הפסדתי שוב אז להמר על סכום שיכסה את ה- 600 הפסד ויביא לי רווח נטו 200 וכן הלאה…
בהנחה שאני לא יכול להפסיד לנצח אני ארוויח מתישהוא את ה- 200 דולר הללו ואפרוש מהקזינו עם 200 דולר רווח באותו הלילה (לא רע).
השאלה היא מה הסיכוי שיגמר לי הכסף לפני שאצליח להרוויח את ה200 דולר (נאמר שיש לי מגבלה של 20000 דולר).

lior [אתר] בתאריך 7/20/2005 6:24:15 AM

גילי

בו נבדוק.
ב 20,000 הדולר שלך אתה יכול להשתמש (20,000/100) פעם להימור של 200 דולר. בגלל שאתה מתכוון להכפיל את הסכום ב 2 בכל שלב, אתה יכול להמר רק
log2(20000/200) פעמים. אם נעלה קצת את הסכום הכולל שאתה מוכן להשקיע זה יוצא 7.
הסיכוי שתזכה בפעם הראשונה הוא 0.5^1. הסיכוי שתזכה בפעם השניה הוא 0.5^2, וכן הלאה. מתקבל כאן טור הנדסי מ 1 עד 7 שאת סכומו ניתן לחשב על ידי:
0.5*)0.5^7-1(/)0.5-1(
כלומר, הסיכוי שתזכה ב 200 דולר הוא 0.99218.
אם השקעת ב 7 סיבובים סכום של 25,600 דולר, תוחלת ההפסד שלך שווה ל:
)1-0.99218(*25,600(=~200
תוחלת הרווח גם היא 200 דולר. לכן, כצפוי, לא הרווחת ולא הפסדת.

lior [אתר] בתאריך 7/20/2005 6:25:49 AM

טעות קטנה

ב 20,000 דולר אפשר להמר 20,000/200 שזה 100 פעמים.

yoav בתאריך 7/20/2005 1:28:40 PM

שיטה מוצלחת, אבל:

מהסיבה הזו, בתי הימורים מגבילים את הסכום המקסימלי שמותר להמר, וכך חוסמים את יעילות השיטה.

יוסי לוי [אתר] בתאריך 7/20/2005 10:32:27 PM

בעניין שיטת ההכפלה

אני ממליץ לכל מי ששוקל להשתמש בשיטה זו בביקורו הקרוב בקזינו, לקרוא את מה שנכתב במדור השאלות הנפוצות של פורום המתמטיקה של תפוז על הנושא הזה:
http://www.tapuz.co.il/tapuzfo….mFAQAnswer.asp?id=457&QID=2033

גילי נחום בתאריך 7/26/2005 5:03:12 AM

אנסה לסכם:

לינק מעולה, תודה יוסי.
1. הסכומים שצריך לשריין על מנת להיות בטוחים באחוזים גבוהים שלא יגמר לנו הכסף הם אדירים.
2. גם אז תמיד ישנו הסיכוי (גם אמנם קטן) שנפסיד את הסכומים ששריינו (שלהזכירכם הם סכומים אדירים) מכיוון שנגמר לנו הכסף. האם אנו מוכנים לסיכון זה?
3. בפועל לא עומד לרשותנו סכום כל כך גדול לשריין לצורך הפרוייקט ולכן הוא לא בר ביצוע, ובמידה וכן עומד לרשותנו הסכום הנ"ל אז אנו עשירים דה פקטו ולמה להתעסק בשטויות במקום לקחת חופשה בקנקון?!
הדגמה קטנה!
נצהיר שמטרתנו היא לסיים את הערב עם 200 רווח.
סדר ההימורים וסכומם:
1. 200
2. 400 (מכסה הפסדים 200 ורווח 200)
3. 800
4. 1,600
5. 3,200 (מכסה הפסדים 3000 ורווח 200)
6. 6,400
7. 12,800
8. 25,600
…
נניח ומגבלת התקציב שלנו היא 12600, לכן נאלץ לעצור לאחר ההימור ה- 6 (כי 6400+3200+1600+800+400+200= 12,600)
ההסתברות שנגיע למצב זה היא 0.5 בחזקת 6 (בערך אחוז וחצי) ולכן בממוצע נפסיד כל ערב
196.875.
ההסתברות שנרוויח 200 בסוף הערך היא 1 מינוס ההסתברות של פשיטת רגל ובממוצע נרוויח כל ערב
בדיוק 196.875.
ולכן בסך הכל לאורך זמן לא הפסדנו ולא הרווחנו (כי ההימור הוא הוגן)
אם ההימור לא יהיה הוגן אז באותה צורה בדיוק לאורך זמן נצפה להפסדים.
כלומר תוחלת הרווח תשאר שלילית.

יניב בתאריך 1/28/2008 1:45:19 AM

מה עם האפס

נראה לי ששכחתם פרט קטן, בנוסף לשחור ואדום יכול לצאת "0" שבו הבית זוכה, כלומר לא אדום ולא שחור….

יוסי לוי [אתר] בתאריך 1/28/2008 12:59:10 PM

ליניב

זה לא משנה את העקרון…

נשלח: 2 בדצמבר, 2008. נושאים: הממ... מעניין..., המשפטים הגדולים של הסטטיסטיקה, מה אומרת הסטטיסטיקה.
תגובות: 6 | טראקבק

מאה המשפטים הגדולים של המתמטיקה

באתר של נתן קאהל, סטודנט למתמטיקה בסטיבנס קולג', פורסמה מחדש רשימת מאה המשפטים הגדולים של המתמטיקה, שנערכה בעבר הלא רחוק על ידי פול וג'ק אבד (מי אלה?). להלן עשרת המשפטים המובילים את הרשימה הזו:

על חלק גדול מהמתמטיקאים שנזכרים כאן תוכלו לקרוא במדור "מתמטיקאי השבוע" בפורום המתמטיקה של תפוז. הוספתי לינקים לחלק מהמתמטיקאים והבעיות שאינם נזכרים בתפוז. את השאר תוכלו לגגל 🙂

1) אי הרציונליות של שורש 2 – פיתגורס.
2) המשפט היסודי של האלגברה – גאוס.
3) הרציונליים בני מניה – קנטור.
4) משפט פיתגורס.
5) משפט המספרים הראשוניים – האדאמר, פוסון (וגם ארדש וסלברג שמצאו הוכחה אלמנטרית למשפט זה, אם יורשה לי להוסיף).
6) משפט אי השלמות של גדל.
7) משפט ההדדיות הריבועית – גאוס.
8) אי האפשרות לחלק זווית שלושה חלקים שווים ולחלק קוביה לשני חלקים שווים באמצעות מחוגה וסרגל – ונצל.
9) הנוסחה לחישוב שטח עיגול – ארכימדס.
10) ההכללה של אוילר למשפט הקטן של פרמה.
הקונצפט של "100 המשפטים הגדולים" מעלה מספר תהיות. איך מדרגים בכלל? מה הקריטריון שלפיו משפט כלשהו נכנס לרשימה? ומה עם אלה שלא נכנסו?

בפורום מתמטיקה בתפוז נערך פעם סקר לבחירת המשפט היפה ביותר במתמטיקה. משפט פיתגורס גרף את המקום הראשון עם 30 אחוז מהקולות. האם העובדה שחלק גדול מהגולשים בפורום הם תלמידי תיכון שלא ממש מכירים את משפטי אי בשלמות של גדל או את נוסחת אוילר השפיעה על התוצאה? ייתכן.

בכל מקרה, הרשימה היא שעשוע בלתי מזיק, אז הבה נשתעשע.

gauss

קרל פרידריך גאוס – דגול המתמטיקאים של כל הזמנים – מופיע רק שלוש פעמים

מיהו המתמטיקאי הבולט ברשימה הזו? המוביל הוא אויקלידס, עם שמונה משפטים שלו ברשימת ה-100. אוילר במקום השני עם 6 הופעות. קנטור, אבי תורת הקבוצות, וקושי, שהציב את החשבון הדיפרנציאל והאינטגרלי על יסודות ריגורוזיים, חולקים את המקומות השלישי והרביעי עם 4 הופעות לכל אחד מהם. לגאוס, ארדש ולייבניץ יש שלוש הופעות ברשימת המאה., ושני אזכורים יש לארכימדס, ג'וזף ברטראנד, לגראנז', לינדמן, ניוטון ופיתגורס. בין השמות הבולטים שמופיעים פעם אחת בלבד תמצאו את נילס אבל, יאנוש בולאי, פול כהן, אברהם דה-מואבר, דקארט, דיריכלה, פרמה, פורייה, גדל, רימן ואנדרו ווילס.

כמעט שליש מהרשימה, 32 משפטים, נהגו והוכחו במאה ה-19. 17 משפטים הם מהמאה ה-18, 12 מהמאה ה-20, ו-11 מהמאה ה-17. 17 משפטים הם מהתקופה שבין המאה השישית לפני הספירה ועד המאה השניה לספירה – תור הזהב של המתמטיקה היוונית. משפט אחד מתייחס למאה ה-17 לפני הספירה – זוהי הנוסחה לסכום סדרה חשבונית שהייתה מוכרת לבבלים.

נושא מעניין נוסף הם המשפטים נעדרים מהרשימה – משפט נאש אינו בין מאה המשפטים הגדולים של המתמטיקה, וכך גם משפט אי האפשרות של Arrow, משפט גלואה, משפט השאריות של קושי, הלמה של צורן, וחובבי המתמטיקה המודרנית יחסרו בודאי את משפט האינדקס של עטיה וזינגר. אני בטוח שהקוראים ימצאו עוד משפטים שחסרים לדעתם ברשימת המאה הזו.

bayes

תומאס בייס – הכומר שהכניס את הסטטיסטיקה לסחרור פילוסופי – לא מופיע בין 100 הגדולים

ומה בקשר לנסיכת המדעים? הסטטיסטיקה ותורת ההסתברות זוכים לייצוג מכובד, אם כי תמוה, ברשימה: משפט הגבול המרכזי מופיע במקום ה-47, כאשר בעיית הבחירות (The Ballot Problem) מקדימה אותו וממוקמת במקום ה-31. חוק המספרים הגדולים ממוקם במקום ה-59, בעיית ימי ההולדת ממוקמת במקום ה-93, ובעיית המחט של בופון מופיעה במקום ה-99. יפה, אך בהחלט לא מספיק. חסרים לי מאוד משפט בייס, הביטוי המתמטי הסתברותי של תהליכי הלמידה, הלמה של ניימן ופירסון, המהווה את הבסיס לכל תחום קבלת ההחלטות, ומשפט גאוס-מרקוב, המציג את הדרך אופטימלית לאמידת הקשר הלינארי בין 2 משתנים (ויותר). לו אני ערכתי את הרשימה, כל המשפטים שהוזכרו בפסקה זו היו ללא ספק מככבים במקומות גבוהים.

אבל כפי שאמרתי – מדובר רק בשעשוע – ואני קיבלתי מוטיבציה לסדרת רשימות על המשפטים הגדולים של הסטטיסטיקה (עכשיו רק צריך למצוא את הזמן).

פורסם לראשונה באתר רשימות ב 10 ביולי 2005 שם התקבלו 7 תגובות

מפגש התיכונים בתאריך 7/11/2005 12:15:48 AM

רגע, מה עם

"טוב ציפור אחת ביד משתיים על העץ"?

אורן [אתר] בתאריך 7/11/2005 8:54:58 AM

מה עם משפט דרייפוס?

אני חושב שהמשפטים ה"יפים" או ה"חשובים" נבחרים לפי איזה יחס הפוך בין קלות הניסוח וההבנה של הטענה שהם מביעים יחד עם ההוכחה לבין ה"יסודיות" שלהם. משפט איזוטרי מתורת החבורות לא יחשב כמו משפט גדל שהוכחתו לא טריוויאלית אבל גם לא בשמיים אך השפעתו מרובה.
משפט גדל לא יחשב כמו משפט פיתגורס (למרות שאולי הוא חשוב יותר) כי משפט פיתגורס הוא מיידי להבנה והוכחה.
זו, בערך, התאוריה שלי על משפטים.

אסף ברטוב [אתר] בתאריך 7/11/2005 6:33:46 PM

ללא כותרת

אשמח מאוד לקרוא רשימות על משפטי הסטטיסטיקה!

אריה בתאריך 7/16/2005 9:44:28 AM

קנטור

העובדה כי הרציונליים הינם בני מניה היא טריוויאלית. המשפט החשוב הוא כי הממשיים אינם בני מניה (ומכאן כי האירציונליים אינם בני מניה).
ברוב הסקרים על גדולי המתמטיקאים מככבים אוילר (שהיה פורה במידה שלא תאמן, ועד היום לא כל כתביו פורסמו!) וגאוס (שאחראי על כמה מהתובנות היותר מעמיקות) – אך, כאמור, זהו שעשוע בלבד 🙂 .

יוסי (אחר) בתאריך 7/17/2005 12:50:28 AM

ללא כותרת

המשפט הראשון הוא של אוקלידס
משפט קנטור (עם האלכסון) הוא שהממשיים אינם בני מניה

בעיות בניה בתאריך 9/4/2006 3:07:48 PM

הכפלת קוביה

כתבתם 'לחלק קוביה לשני חלקים שווים והבעיה הבלתי פתירה היא דווקא הכפלת הקוביה

יוסי לוי [אתר] בתאריך 9/5/2006 11:29:10 AM

תגובה לבעיית בניה

אתה צודק. תודה על ההערה.

נשלח: 2 בדצמבר, 2008. נושאים: הממ... מעניין....
תגובות: אין | טראקבק

בין שתי טעויות

אתה נוהג ברכבך בכביש צר, בו יש נתיב אחד לכל כיוון. לפניכם נוסעת משאית באיטיות מרגיזה. אתה רוצה לעקוף את המשאית, אך היא חוסמת את רוב שדה הראיה שלך. נוסף לכך, משאיות נעות מדי פעם גם בכיוון הנגדי. לעקוף או לא לעקוף?

אם לא תעקוף תאחר למחוז חפצך. זה מרגיז, כי מדי פעם אתה רואה כי היית יכול להספיק לעקוף בביטחה. לעומת זאת, אם תצא לעקיפה אתה עלול למצוא את עצמך בהתנגשות חזיתית עם משאית שנוסעת בכיוון הנגדי. מה עושים? איך מחליטים?

יצאתם לטיול ביער וגיליתם פטריות. אתם מאוד אוהבים פטריות, אבל גרועים בזיהויין. האם תאכלו את הפטריות? אולי אלה הן פטריות רעילות? אם הפטריות ראויות למאכל ותחליטו לוותר על אכילתן, הפסדתם ארוחה טעימה. לעומת זאת, אם תאכלו פטריות רעילות, מצבכם עדין.

אבל, מה תעשו אם הגעתם לאי בודד לאחר שספינתכם נטרפה, ותגלו כי המאכל האפשרי היחיד באי הוא פטריות?

רופא בודק חולה שמצבו חמור. יש שני גורמים אפשריים למצבו של החולה, ולכל אחד מהגורמים קיים טיפול יעיל. אולם, מתן הטיפול לגורם אחד יהיה קטלני אם המחלה נגרמה עקב הגורם השני. אי אפשר לתת את שני את שני הטיפולים ביחד. כאן, לשתי הטעויות האפשריות יש תוצאה מרה אחת.

נאשם עומד למשפט. ייתכן כי הנאשם חף מפשע, ובכל זאת העדויות ישכנעו את השופט כי הוא אשם. אדם חף מפשע יישלח במקרה זה לכלא. ייתכן גם כי הנאשם אמנם ביצע את הפשע המיוחס לו, אך הראיות שיוצגו במשפט לא יספיקו כדי להרשיעו. במקרה זה, הפושע "יחזור לרחובות". זוכרים את הסקר הזה?

איזו טעות עדיפה?

איך יכריע השופט את הדין כך שיקטין את הסיכוי להרשיע חף מפשע וגם את הסיכוי לשלח פושעים מסוכנים לחפשי?

נניח שהשופט אדם בעל עקרונות הרואה בשליחת חף מפשע לכלא טעות בלתי נסבלת. שופט כזה ידרוש ראיות רבות יותר ובעלות משקל רב יותר לצורך הרשעה, ולכל ספק שיינטע בליבו לגבי אשמתו של הנאשם הוא ייתן משקל נכבד. השופט כמובן ידרוש ראיות כאלה מכל תובע המופיע בפניו, שכן הוא שופט את כולם ללא משוא פנים, וכל נאשם הריהו בחזרת חף מפשע עד שלא תוכח אשמתו. שופט זה עדיין עלול לטעות לעיתים ולהרשיע נאשם חף מפשע, אך הסיכוי לכך הוא קטן.

אבל אין ארוחות חינם. המחיר שמשלם שופט זה הוא בסיכויים גבוהים יותר לזיכוי נאשמים שאינם חפים מפשע, כי כאמור, גם מתובעיהם של נאשמים אלה דורש השופט ראיות רבות ומוצקות.

חברו של השופט, היושב בדין באולם הסמוך, סבור לעומת זאת כי יש להמנע ככל האפשר מזיכוי מוטעה של אשמים. הוא מסתפק בראיות קלות יותר כדי להשתכנע כי הנאשם העומד מולו אכן אשם. רק לעתים רחוקות יזכה שופט זה בטעות אדם אשר אכן ביצע את הפשע המיוחס לו. אבל בלהטו לשלוח את הפושעים אל מאחורי סורג ובריח, שולח שופט זה גם חפים מפשע אל הכלא, ובתדירות גבוהה יותר מאשר חברו המקשה על התובעים.

בואו נחזור אל הדוגמה שפתחה את המאמר. אני, למשל, אעדיף להמשיך ולנסוע מאחורי המשאית, ולא לקחת סיכון של עקיפה כאשר שדה הראיה חסום. ואם אפשר היה לעקוף? טוב, אז טעיתי ולא עקפתי. קצת איחרתי. לא נורא. העיקר שלעולם לא אמצא את עצמי דוהר לתוך משאית הנוסעת מולי. הסיכוי שאעשה את הטעות הראשונה – לא לעקוף כאשר אפשר – הוא 1, אבל בתמורה הקטנתי את הסיכוי לעשות את הטעות האפשרית השניה – עקיפה בנתיב לא פנוי – ל-0.

אבל השופט לא יכול להרשות לעצמו מדיניות כזו. אי אפשר לשלוח את כל הנאשמים לכלא, למרות שזה מבטיח כי אף פושע לא יסתובב חופשי ברחובות, וגם אי אפשר לזכות את כל הנאשמים, למרות שכך מובטח כי לא תשלל חירותו של אף אדם חף מפשע. השופט חייב לאמץ כלל החלטה לפיו יקבע לגבי כל נאשם האם הוא אשם או חף מפשע.

בכל מצב של קבלת החלטות חוזרת הסיטואציה הזו – כל החלטה עשויה להיות מוטעית, ונסיון להקטין את הסיכוי לטעות מסוג אחד מגדיל את הסיכוי לטעות מהסוג השני, ולהיפך. יש שתי אפשרויות להתמודד עם הבעיה הזו. הדרך הראשונה היא לאסוף יותר אינפורמציה. כאשר הצגתי את בעיית המשאית בקורס "מבוא לסטטיסטיקה" אותו לימדתי, טענו הסטודנטים, ובצדק, כי אפשר לסטות מעט שמאלה, לראות מה מצב התנועה בנתיב הנגדי, ואז לקבל את ההחלטה אם לעקוף או לא. עדיין יש סיכויים לקבלת החלטה מוטעית, אולם סיכויים אלה קטנים יותר בזכות האינפורמציה הנוספת שהושגה. באופן דומה, אפשר לקחת את הפטריות לבדיקה, לבקש חוות דעת מרופא נוסף, ולזמן עוד אנשים לעדות. אבל כל זה מקטין את ממדי הבעיה העקרונית, ולא פותר אותה. האפשרויות לטעות עדיין קיימות, וכך גם הסיכויים. ומה עושים כאשר לא ניתן לאסוף עוד אינפורמציה או שאיסוף אינפורמציה נוספת פשוט יקר מדי (במונחי זמן או כסף או בכל אופן אחר)?

שני סטטיסטיקאים, גרז'י ניימן ואגון פירסון, הציעו גישה אחרת לבעיה. הבה נקבע עבור אחת הטעויות האפשריות סיכוי לטעות שניתן "לחיות איתו", נניח 5%. עכשיו נסתכל על כל כללי ההחלטה האפשריים שבהם הסיכוי לטעות הוא 5%. האם יש בינהם כלל החלטה עבורו הסיכוי לטעות את הטעות מהסוג השני הוא מינימלי? בודאי. האם ניתן לאפיין את הכלל הזה? ניימן ופירסון הוכיחו שכן. האפיון של כלל ההחלטה האופטימלי ידוע בשם המתחייב "הלמה של ניימן ופירסון".

גרז'י ניימן (מימין) ואגון פירסון. בין השנים 1928 ל-1933 פרסמו השניים סדרת מאמרים שעיצבה מחדש את הסטטיסטיקה המודרנית.

כדי להסביר את הלמה של ניימן ופירסון אגדיר מחדש את המושגים שבבסיסה.

שני המצבים האפשריים (הכביש פנוי או לא פנוי לעקיפה, הנאשם חף מפשע או אשם) נקראים "השערות". אחת ההשערות היא "ההשערה הבסיסית" או "השערת האפס", וההשערה השניה היא "ההשערה האלטרנטיבית". אציין כי בדרך כלל ההשערה הבסיסית היא המצב בו מקובל להאמין. כך למשל, מקובל כי כל נאשם העומד לדין הינו בחזקת חף מפשע עד שיוכח אחרת, ולכן בבית המשפט ההשערה הבסיסית אומרת כי הנאשם חף מפשע. כיוון שכך, על המחליט למצוא כלל החלטה לפיו ידחה את ההשערה הבסיסית (ואז יקבל את ההשערה האלטרנטיבית) או שלא ידחה את ההשערה הבסיסית (ואז לא יקבל את ההשערה האלטרנטיבית), וכל זאת בהסתמך על אינפורמציה נתונה.

דחיה מוטעית של ההשערה הבסיסית מכונה לכן בפי הסטטיסטיקאים "טעות מהסוג הראשון", וההסתברות לדחיה מוטעית של ההשערה הבסיסית נקראת רמת המובהקות של כלל ההחלטה. קבלה מוטעית ¹ של ההשערה הבסיסית נקראת בפי הסטטיסטיקאים "טעות מהסוג השני". בדרך כלל מעניינת ההסתברות לא לטעות טעות זו, כלומר ההסתברות לא לטעות את הטעות מסוג השני. הסתברות זו לכן זכתה לשם מיוחד משלה: העצמה של כלל ההחלטה.

ובכן, הלמה של ניימן ופירסון מאפיינת את כלל ההחלטה האופטימלי – שהוא כלל ההחלטה בעל העצמה המקסימלית מבין כל כללי ההחלטה ברמת מובהקות נתונה.

ניימן ופירסון מציעים לחשב את ההסתברות P0 כי נצפה באינפורמציה שיש בידנו לו המצב האמיתי הוא מצב ההשערה הבסיסית, וכן את ההסתברות P1 לצפות באינפורמציה זו לו המצב האמיתי הוא מצב ההשערה האלטרנטיבית. כלל ההחלטה מורכב מהיחס של שתי הסתברויות אלה. אם היחס P1/P0 גדול מסף מסויים, נחליט כי המצב האמיתי הוא המצב המתואר כל ידי ההשערה האלטרנטיבית, כלומר נדחה את ההשערה הבסיסית. אם לא, אזי לא נדחה את ההשערה הבסיסית. את ערך הסף נקבע כך שלכלל ההחלטה שלנו תהיה רמת המובהקות (כלומר, הסתברות לדחיה מוטעית של ההשערה הבסיסית) הרצויה לנו. על פי הלמה של ניימן ופירסון, מובטח לנו כי כלל ההחלטה הינו בעל עצמה מקסימלית (כלומר ההסתברות לקבלה מוטעית של ההשערה הבסיסית היא מינימלית).

הלמה של ניימן ופירסון היא ככל הנראה המשפט השימושי ביותר בסטטיסטיקה. זה לא מפתיע, כיוון שתפקידה המרכזי של הסטטיטיקה הוא לאפשר קבלת החלטות בתנאי אי ודאות. ניימן ופירסון נתנו בידנו את הכלי לבניית כלל ההחלטה הטוב ביותר האפשרי.

פורסם לראשונה באתר "רשימות" בתאריך 6 באוגוסט 2005 22:25, שם התקבלה תגובה אחת

Technorati Tags: קבלת החלטות,סטטיסטיקה

חיים פ בתאריך 5/29/2006 11:48:16 PM

לא ברור

לא הדגמת את הישום האחרון (שופט)
הבא נניח שאני יכול לבצע עקיפה מוצלחת בהסתברות של 99%
או בהסתברות של 98%
מהם פתרונות שמציעה הלמה?

נשלח: 1 בדצמבר, 2008. נושאים: המשפטים הגדולים של הסטטיסטיקה, מה אומרת הסטטיסטיקה, קבלת החלטות.
תגובות: 2 | טראקבק

בחירות 1936 – המנצח שלא היה

פרנקלין ד. רוזוולט - הנשיא המכהן, מתמודד על כהונה שניה

בשנת 1936 פרנקלין ד. רוזוולט סיים את כהונתו הראשונה כנשיא ארצות הברית, והעמיד עצמו לבחירה לכהונה שניה. מולו התמודד אלפרד מ. לנדון, מושל קנזס, נציג המפלגה הרפובליקנית.

ארה"ב עדיין הייתה בתהליכי התאוששות מהמשבר הכלכלי של 1929. למרות שמדיניותו של רוזוולט, שהתבססה על פרוייקטים ממשלתיים ותקציב גרעוני החלה לשאת פירות, המצב הכלכלי של המדינה היה עדיין קשה ביותר. לנדון התנגד למדיניות זו, ותקף את רוזוולט בתחום הכלכלי.

לקראת הבחירות ערך המגזין Literary Digest סקר שנועד לחזות את תוצאות הבחירות. ה-Digest ערך סקרי בחירות בקביעות החל מבחירות 1916, ותמיד הצליח לחזות את תוצאות הבחירות בדיוק רב. תוצאות הסקר של 1936 , שהתבסס על 2.4 מליון משיבים, חזו כי לנדון יזכה ב-56% מכלל הקולות, ובתפקיד הנשיא הבא של ארצות הברית.

אלפרד לנדון - המועמד המוביל בסקרים

המציאות הייתה שונה, כידוע. רוזוולט זכה ב-62% מהקולות וגרף את האלקטורים של 46 מדינות, ובינהן גם קנזס, מדינתו של לנדון. לנדון הסתפק ב-8 אלקטורים בלבד. מה קרה? מדוע סקר הבחירות הגדול ביותר שנערך אי פעם הניב תוצאה כה שגויה? כדי להבין זאת, עלינו לדעת כיצד נדגמו המשיבים.

ובכן, המגזין שלח שאלונים לבתיהם של 10 מליון מצביעים פוטנציאליים, וביקש מהם לשלוח בדואר חוזר את אופן הצבעתם. 7.6 מליון מהנמענים לא טרחו לענות. שיעור התגובה לסקר היה 24% בלבד. המשיבים נבדלים מהלא משיבים בכך שהשיבו לסקר, כמובן, אך הנסיון שהצטבר מאז הראה כי הבדל זה משקף הבדלים נוספים. האם אותם 2.4 מליון משיבים מייצגים את 10 מליון המצביעים אליהם נשלח שאלון הסקר? ככל הנראה לא.

אחד מ-10 מליון השאלונים שנשלחו בסקר הבחירות שערך ה-Literary Digest ב-1936

בעיה נוספת, חמורה יותר, נבעה מרשימת הנמענים. כיצד תשיגו שמות וכתובות של 10 מליון איש? ה-Digest השתמש בספרי הטלפונים וברשימות של חברי מועדונים. ב-1936 היו בארצות הברית 12 מליון טלפונים, ו-9 מליון מובטלים. אפשר להניח כי רשימת המובטלים הייתה שונה למדי מרשימת בעלי הטלפונים, וכי דעתם של בעלי הטלפונים וחברי המועדונים בענייני כלכלה שונה מדעת המובטלים. הסקר של המגזין דגם באופן שיטתי מצביעים שמצבם הכלכלי היה טוב, ולכן לא בהכרח תמכו במדיניותו של הכלכלית של רוזוולט.

שיטת הסקירה של ה- Literary Digest שפעלה היטב במשך 5 מערכות בחירות, כשלה בפעם השישית. כל עוד מערכות הבחירות לא נסבו על עניינים כלכליים, ההטיה במדגם לטובת העשירים לא גרמה לעיוות התוצאות – שכן בעניינים של מדיניות חוץ אין בהכרח הבדלי דיעות משמעותיים בין עניים לעשירים. כאשר נושא הבחירות היה כלכלי, הסקר חזה היטב את אופן הצבעתם של העשירים, אך לא לקח בחשבון את דעתם של העניים והמובטלים שהכריעו את הבחירות ההן.

ה-Literary Digest פשט את הרגל וחדל לצאת לאור זמן קצר לאחר בחירות 1936, וגם שיטת הדגימה שלו חלפה מן העולם. על עולם הסקרים השתלט ג'ורג' גאלופ, שבעזרת מדגם של 50000 איש בלבד חזה את נצחונו של רוזוולט, ובמדגם נוסף של 3000 איש בלבד חזה גם את הטעות של ה-Digest. שיטת הדגימה החדישה שפיתח גאלופ תשלוט בעולם הסקרים עד 1948.

פורסם לראשונה באתר "רשימות" בתאריך 4 בנובמבר 2004 שם התקבלו 3 תגובות

אורי [אתר] בתאריך 11/5/2004 8:07:01 AM

רשימה מרתקת. מעניין שכבר לפני שבעים שנה השתמשו במידגם עצום כל כך לצורך עריכת סקר בחירות. קשה לדמיין שהיו להם משאבים כה רבים.

כמה דברים: באותה שנה נחשב כבר הטלפון למכשיר עממי למדי, לא יקר מדי לרכישה ולהתקנה. להערכתי, גם אם הושגו שמות וכתובות הנשאלים מספרי הטלפונים אין בכך כדי להעיד על אי-תקינות בהנחות היסוד. השאלה, להערכתי, היא מאלו ספרי טלפונים נלקחו השמות.

המיתון באותן שנים כבר היה בירידה. מכל מקום, מדינות ניו אינגלנד, למשל, נגעו פחות מאזורי המערב, המרכז והדרום. באזורים אחרונים אלה, הוכיח הניו-דיל את עצמו באופן שהעניק לרוזוולט לעתים למעלה מתשעים אחוז מהקולות (דרום קרולינה ומיסיסיפי), או לפחות למעלה משבעים אחוז (כל המדינות ממערב לקו מונטנה-ניו מכסיקו ומדרום לקו וירג'יניה-טקסאס). כלומר, אם הסוקרים עשו שימוש בספרי טלפונים של איזורים מסוימים בניו אינגלנד (מיין או ורמונט, למשל), כולל אפילו ניו יורק וסביבתה, ולא עשו שימוש בספרי טלפונים של איזורים בדרום ובמערב, יתכן שזו הייתה הסיבה לטעות.

אגב, הבחירות לנשיאות ארה"ב הביאו בכנפיהן כמה פרדוכסים מעניינים בעבר, כמו נשיא שנבחר בקולות שלושים אחוז מהתושבים בלבד או נשיא שזכה בניצחון על חודו של אלקטור בודד כשקיבל את מיעוט הקולות. עמדתי על כך במאמר שפרסמתי כאן: http://www.aplaton.co.il/story_56

איציק [אתר] בתאריך 12/20/2006 11:19:32 PM

לדuגמא, ניתקלתי בסקר שנערך בפורומים מסוימים בתפוז, במסגרת מחקר כלשהו. המדגם מראש מוטה כיוון שכולל את כל אלו שבוחרים להשתתף בסקר. יתרה מזאת, השאלות בסקר מנוסחות באופן די נוקשה (כן/לא בלבד וחובה לענות על כל השאלות), ולכן המדגם מצטמצם עוד לאלו שמוכנים לקבל על עצמם את הכללים שקבע עורך הסקר.
מספרים על מינה צמח שהיטיבה מחנוך סמית לחזות את תוצאות הבחירות בגלל המתכון הסודי שלה:
"קח מה שיצא אחרי כל החישובים, ותעביר 3 מנדטים לימין".

אלעד [אתר] בתאריך 7/16/2007 3:09:55 PM

אבל אני עדיין לא מאמין לסקרים

נשלח: 29 בנובמבר, 2008. נושאים: מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

המשוואה הגדולה מכולם

הירחון Physics World ערך בין קוראיו סקר לבחירת המשוואה היפה ביותר של כל הזמנים. תוצאות הסקר פורסמו בגליון האחרון.

את המקום הראשון חלקו משוואות האלקרומגנטיות של מקסוול והנוסחא הנצחית של אוילר:

הסקר עסק בנוסחאות פיזיקליות (שלא ממש מעניינות אותי), ולכן העובדה שמשוואת אוילר הביסה פייבוריטים כמו הנוסחה המפורסמת של איינשיין (e=mc²), החוק השני של ניוטון (F=ma) ומשוואות שרדינגר (שדווקא כן מדברות אלי בגלל האלמנט ההסתברותי שהן מבטאות – ראו את הלוגו של הטור הזה על אלוהים והקוביות), מרגשת אותי במיוחד.

למקומות מכובדים הגיעו גם משפט פיתגורס והשוויון שרק נראה פשוט, האומר כי 2=1+1.

פורסם לראשונה באתר "רשימות" בתאריך 11 באוקטובר 2004 00:00 במדור ….הממממ… מעניין שם התקבלו 4 תגובות

אורן [אתר] בתאריך 10/11/2004 11:44:34 AM

חבל שלא שאלו אותי 🙁

כמובן שאני מעדיף את 1+1=2 (את המשוואה הזו אני מבין) אבל הייתי משנה את זה ל 1+0=1 ומתמוגג גם מקיום איבר נייטרלי לחיבור.

גלעד חלפון בתאריך 10/11/2004 4:21:20 PM

אבל זו לא תהיה חוכמה 🙂

תקח משהו כמו a+0=a, המשפט לעיל אומר רק שהוא נייטרלי ביחס ל1, וזה לא מרשים מדי.

אורן [אתר] בתאריך 10/11/2004 7:43:27 PM

להזכירך את אקסיומות פיאנו 🙂

הכל נובע (בערך) מאבר יחידה, פעולת החיבור ואקסיומת האינדוקציה. a (בשלמים) הוא תוצר של כמה פעולות חיבור של 1.

בתאריך 10/14/2004 12:03:29 AM

ללא כותרת

1+1=10 לא?

נשלח: 29 בנובמבר, 2008. נושאים: כללי.
תגובות: אין | טראקבק