היסטוריה | נסיכת המדעים

ארכיב עבור תגית היסטוריה

הרצאה של פרופ' מריו ליביו – 17 לדצמבר‬

פרופ' מריו ליביו, מחברם של מספר ספרי מתמטיקה פופולרית, ירצה בתאריך 17.12.09 במועדון האסטרונומי של אוניברסיטת תל אביב בנושא ספרו האחרון "האם אלוהים הוא מתמטיקאי?". לפרטים לחצו כאן. אני אשתדל מאוד להיות שם.

אני קורא כעת את ספרו האחרון של ליביו. לשבחו אוכל לומר שסגנון הכתיבה שלו משתפר, והספר יותר מעניין לקריאה מספריו הקודמים. התכנים שבספריו מרתקים כמובן, בלי קשר לסגנון הכתיבה. בספר האחרון יש פרק העוסק בסטטיסטיקה – אני חייב לומר שקצת התאכזבתי כשקראתי אותו. מקווה לדווח בקרוב על רשמי מהקריאה.

נשלח: 3 בדצמבר, 2009. נושאים: כללי.
תגובות: 1 | טראקבק

הכוכב, הסמים והכומר

לפני כחודשיים דיווחתי כאן על השעייתו של סופרסטאר הבייסבול מני רמירז ל-50 משחקים, לאחר שבבדיקת סמים שנערכה לו התקבלה תוצאה חיובית. עם הדיווח העליתי נקודה למחשבה: לאור העובדה שבבדיקה התקבלה תוצאה חיובית, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים? נתתי גם רמז עבה לפתרון: מספר 4 ברשימת 15 הסטטיסטיקאים הגדולים.

הבטחתי רשימה בנושא, והנה אני סוף סוף מקיים. לזירוז העניין תרם דוברמן, שפרסם בבלוג שלו את החידה הזו. ההקשר היה שונה (שפעת החזירים במקום סמים אסורים), אבל העקרון זהה. מי שמעוניין לקרוא את הפתרון של דוברמן יכול לקרוא אותו בלינק הזה, אם כי אני מייד אתן הסבר משלי וגם ארחיב על הנושא.

ובכן, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים אם בדיקת הסמים שלו הייתה חיובית? התשובה האמיתית והכנה ביותר שאני יכול לתת לכם היא שאני לא יודע. חסרים נתונים. אז בואו ונמציא נתונים לצורך התרגיל. בדיקת הסמים יכולה לטעות. יכול להיות שנבדק כלשהו משתמש בסמים אסורים, ובכל זאת מתקבלת תוצאה שלילית בבדיקה. גם יכול להיות שהנבדק לא השתמש בסמים אסורים ותוצאת הבדיקה בכל זאת הייתה חיובית משום מה (רמירז לא טען זאת, דרך אגב). אלה הן שתי הטעויות שעשויות לקרות בכל תהליך קבלת החלטות. אבל באיזה סיכוי עשויה כל טעות להתרחש? אני אניח, כמו דוברמן בחידה שלו, כי לכל טעות יש סיכוי של אחוז אחד, כלומר 0.01. (את הסיכויים האמיתיים יודעים מן הסתם יצרני ערכת הבדיקה). עדיין אין מספיק נתונים. כדי לענות על השאלה צריך גם לדעת מהו אחוז משתמשי הסמים באוכלוסיה הרלוונטית, ואת האחוז הזה קשה מאוד לברר. אני מעריך את המספר הזה ב-5 עד 10 אחוז. מסמך פנימי של ליגת ה-MLB שהודלף לאחרונה אמר כי בשנת 2003 התקבלו תוצאות חיוביות אצל 104 שחקנים שנבדקו (אשמח ללינק – לא מצאתי את הידיעה המקורית). בליגה יש כ-1000 שחקנים, ולכן אחוז המשתמשים הוא בסביבות 10. יש הסבורים כי "תקופת הסטרואידים" שהחלה לקראת סוף שנות התשעים של המאה הקודמת כנראה חלפה כבר מן העולם. אני סבור כי השחקנים פשוט עברו להשתמש בחומרים חדשים, שבבדיקות הנוכחיות לא מזהות. יש להם תמריץ כלכלי לכך. בואו ניקח את המספר העגול של 10% לצורך התרגיל.

נניח שכל 1000 השחקנים נבדקים. מתוכם 100 משתמשים בסמים אסורים, על פי הנחתנו, ומכיוון שהבדיקה תתן תוצאה חיובית אם הנבדק משתמש בסמים ב-99 אחוז מהמקרים, נקבל (תיאורטית) 99 תוצאות חיוביות ותוצאה שלילית אחת. 900 השחקנים האחרים נקיים, ועבור 99% מהם תוצאת הבדיקה תהיה שלילית. כלומר, יתקבלו 891 תוצאות שליליות , ואילו 9 שחקנים חסרי מזל יקבלו תוצאה חיובית (ואלי יושעו) הגם שלא השתמשו בסמים אסורים. נרכז את המספרים האלה בטבלה:

		תוצאת הבדיקה
		חיובית	שלילית	סה"כ
משתמש בסמים אסורים?	משתמש	99	1	100
משתמש בסמים אסורים?	לא משתמש	9	891	900
	סה"כ	108	892	1000

מתוך 108 שחקנים עבורם התקבלה תוצאה חיובית, 99 אכן משתמשים בסמים, ולכן ההסתברות כי שחקן שתוצאת הבדיקה שלו חיובית אכן משתמש בסמים היא 99/108 כלומר כמעט 92%.

שימו לב כי התוצאה תלויה בהנחה הראשונית על אחוז השחקנים המשתמשים בסמים, שאינו ידוע לנו. אם האחוז הזה הוא רק 5% ולא 10%, אז ההסתברות כי השחקן "שלנו" אכן השתמש בסמים תהיה "רק" 84%.

עכשיו בואו נעזוב את החישובים, ונעבור לדיון עקרוני בתרגיל שנעשה. אנו התמקדנו בשני מאורעות. צפינו במאורע "בבדיקת הסמים התקבלה תוצאה חיובית" והתעניינו במאורע "השחקן שנבדק משתמש בסמים אסורים". כמו כן היו נתונות לנו מספר הסתברויות. הייתה ידועה לנו, בין היתר ההסתברות כי תוצאת בדיקת הסמים היא חיובית כאשר ידוע כי השחקן הנבדק משתמש בסמים אסורים. אבל ההסתברות שעניינה אותנו באמת הייתה ההסתברות כי השחקן הנבדק משתמש בסמים אסורים כאשר ידוע כי תוצאת בדיקת הסמים היא חיובית. שתי ההסתברויות שתיארתי הן הסתברויות מותנות, אבל מתארות מצבים שונים. אחת מתארת הסתברות של מאורע שקורה בהווה (תוצאת הבדיקה חיובית) בהנתן מאורע שקרה בעבר (השחקן השתמש בסמים אסורים). השניה מתארת הסתברות של מאורע שקרה בעבר בהנתן מאורע שקרה בהווה. החישוב שלנו "הפך" את כיוון זרימת הזמן: מההווה לעבר במקום מעבר להווה. וכזכור, כל התרגיל שלנו לא היה מתאפשר ללא הנחה אפריורית כלשהי על אחוז השחקנים המשתמשים בסמים אסורים. הבדיקה אפשרה לנו לעדכן את ההסתברות האפריורית לכך שהשחקן השתמש בסמים אסורים, ולהחליף אותה בהסתברות אפוסטריורית.

הנה תיאור אפשרי אחר של התהליך: בהתחלה לא היה לנו כל ידע לגבי הרגלי השימוש של השחקן המסוים בסמים אסורים, ולכן הנחנו כי הסיכוי לכך שהוא משתמש בסמים כאלה שווה לפרופורציית השחקנים המשתמשים בסמים. הבדיקה שנערכה ותוצאתה נתנו לנו אינפורמציה חדשה, וממנה למדנו כי ההסתברות שהשחקן משתמש בסמים גבוהה הרבה יותר. החישוב שעשינו הוא מעין ביטוי מתמטי לתהליך למידה.

הראשון שניסח את התרגיל ההסתברותי הזה בכתובים היה כומר אנגלי שחי לו במאה ה-18, ושמו תומאס בייס. בייס היה ידוע כמי שעוסק במתמטיקה, ואף היה חבר החברה המלכותית, אם כי בימי חייו לא פרסם אף לא מאמר אחד שתיעד את עבודתו. המאמר המתמטי היחיד שהתפרסם תחת שמו הופיע רק שנתיים לאחר מותו, וזהו למעשה מכתב ששלח לידידו ג'ון קאנטון. במכתב תיאר בייס את הדרך לחשב "הסתברות מותנה הפוכה" (שתיארתי זה עתה). הדוגמא שהביא בייס עסקה, אגב, בסיכויי הנצחון במשחק ביליארד, במיטב המסורת של התפתחות תורת ההסתברות בהתאם לצרכיהם של המהמרים. למעוניינים לקרוא את המאמר עצמו, הנה קישור לקובץ pdf. עותק מקורי של המאמר, דרך אגב, יעלה לכם כ-4200 דולר, אם תמצאו מישהו שמוכן למכור.

הקוראים הותיקים של הבלוג הזה אמורים לדעת כי הזכרתי את בייס בעבר. הוא מופיע במקום ה-4 ברשימת 15 הסטטיסטיקאים הגדולים שערכתי. בעבר קוננתי על כך שמשפט בייס לא הופיע ברשימת 100 המשפטים הגדולים של המתמטיקה שערך מישהו. במסגרת התחקיר לרשימה זו הגעתי ל"פרוייקט מילניום" שנערך על ידי המרכז למדעים קוגניטיביים אוניברסיטת מינסוטה, שניסה לבחור ולדרג את 100 העבודות המשפיעות ביותר על המדעים הקוגניטיביים. מאמרו של בייס היה בין 306 העבודות המועמדות, אך פאנל המומחים שביצע את מלאכת הדירוג לא חשב שהעבודה ראויה דיה כדי להכלל ב-Top 100.

כפי שציינתי כאן בעבר, על הבסיס שהניח בייס צמח ענף שלם של הסטטיסטיקה שנקרא כמובן "סטטיסטיקה בייסיאנית". לסטטיסטיקה הבייסיאנית שימושים מרחיקי לכת. היא עומדת בבסיסן של מערכות הבינה המלאכותית למינהן, ומיושמת במגוון תחומים, החל בגנטיקה וכלה בסינון דואר זבל. אני מסתפק כאן בהפניה למאמר שפרסם פרופ' ישראל בנימיני ב-Ynet לפני מספר שנים, בו יש סקירה נאה של המשפט ושימושיו.

נשלח: 19 באוגוסט, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, המשפטים הגדולים של הסטטיסטיקה.
תגובות: 6 | טראקבק

15 הסטטיסטיקאים הגדולים

הקדמה

אמנם יש כאלה שאומרים שפוסטים של רשימות הם כל כך 2006, אבל רשימות הן בכל זאת דבר נחמד, ובמונחי הזמן שלי, 2006 לא כל כך רחוקה. הבלוג המעניין The list universe שאני קורא באופן קבוע (מומלץ) מביא כמעט כל יום רשימה מעניינת של 10 או 15 או 20 ה<שימו כאן כל דבר כמעט>. גם לי מתחשק לכתוב רשימה מהסוג הזה, ואני כידוע לא רק סטטיסטיקאי, אלא גם אדם שאוהב סטטיסטיקה, ולכן הרשימה שלי מביאה באופן טבעי את 15 הסטטיסטיקאים הגדולים ביותר, לדעתי, כמובן. אני צופה שיהיו כאלה שיחלקו על דעתי, יטענו כי הדירוג מקפח את זה ועושה חסד עם זה, ואולי יש מישהו שאינו ראוי להכלל ברשימה ואני כללתי אותו, או להיפך. זה רק שעשוע.

הקריטריון לפיו בחרתי להכניס סטטיסטיקאי (או סטטיסטיקאית) לרשימה הוא אחד ויחיד: מידת ההשפעה שלו על הסטטיסטיקה המודרנית, ואני מתכוון להשפעה ישירה. לכן כל אבות תורת ההסתברות, ובכללם פרמה, הברנולים, פסקל, לפלס, דה-מואבר, ואפילו קולמוגורוב ומרקוב לא מופיעים ברשימה שלי. הם הניחו יסודות, אבל את הסטטיסטיקה שנבנתה על היסודות האלה בנו אחרים. כמו לכל כלל, גם לכלל הזה יש יוצא מן הכלל (נא להמנע מתגובות שעוסקות בפרדוקס השקרן), ומי שתהיה לו סבלנות ימצא את היוצא מהכלל הזה קרוב מאוד לראש הרשימה.

השתדלתי לשמור על ראייה היסטורית. עשרה מהנכללים ברשימה כבר אינם חיים עימנו היום, שלושה נוספים הם בני 90, והצעיר ביותר הינו בן 71. אני יכול לחשוב על כמה סטטיסטיקאים הפעילים כיום שיכולים להימנות ביחד עם ה-15 שבחרתי, אולי במסגרת "רשימת 20", אחד או שניים אף יכולים להכנס לרשימת ה-15 על חשבון אלה שדירגתי בתחתית. אבל אני מעדיף להמתין להיסטוריה שתאמר את דברה.

אז הנה הרשימה שלי. על חלק הנזכרים הרשימה כבר כתבתי בעבר, ואני מצרף לינקים (אני גם מצרף לכל אחד לינק לביוגרפיה שלו בויקיפדיה – לחצו על השם בכותרת). על השאר אני מקווה לכתוב בעתיד, ואעדכן את הלינקים בהתאם. תיהנו.

15. דויד בלקוול (נולד 1919)

דויד בלקוול

סטטיסטיקאי מאוניברסיטת ברקלי, קליפורניה, חוגג באפריל השנה את יום הולדתו ה-90. תרומתו הידועה ביותר לסטטיסטיקה היא חלקו במשפט ראו-בלקוול, המאפשר בניה קונסרוקטיבית של אמד לפרמטר, שהינו עדיף על פני אמד נתון נאיבי כלשהו. בלקוול תרם גם תרומות משמעותיות לסטטיסטיקה הבייסיאנית, תורת המשחקים ותורת ההחלטות הסטטיסטיות.

14. ג'ורג' בוקס (נולד 1919)

ג'ורג' בוקס

סטטיסטיקאי אנגלי שפעל רוב ימיו באוניברסיטת ויסקונסין במדיסון. מחלוצי המחקר בתחומים של סטטיסטיקה בייסיאנית, בקרת איכות, ניתוח סדרות עיתיות ותכנון ניסויים.

13.ק.ר. ראו (נולד 1920)

ק.ר. ראו

סטטיסטיקאי הודי, מתלמידיו של רונלד פישר. שותפו של דויד בלקוול למשפט ראו-בלקוול. תוצאה ידועה נוספת הנושאת את שמו היא אי-שוויון ראו-קראמר, הנותן חסם תחתון לשונותו של אמד, ובכך מהווה הערכה לטיבו. מלבד תרומותיו לתורת האמידה, נודע ראו גם בתרומותיו לפיתוח שיטות לניתוח רב-משתני.

12. פרנק וילקוקסון (1892-1965)

פרנק וילקוקסון

את וילקוקסון אני אוהב במיוחד, כי הוא הגיע אל העיסוק בסטטיסטיקה כמוני – במקרה. הוא בכלל היה כימאי, וחיפש שיטת ניתוח סטטיסטית שלא תהיה תלויה בהתפלגות של הנתונים. הוא חשב על שיטה פשוטה למדי, אך לא הצליח למצוא מראה מקום ביבליוגרפי עבורה. לכן כתב מאמר שתיאר אותה ושלח אותו לכתב עת סטטיסטי, מתוך מחשבה כי המאמר יידחה עם הפניה לעבודה המקורית שמתארת את השיטה, וכך סוף סוף ישיג את ההפניה הביבליוגרפית שחסרה לו למאמר שלו. למרבה הפתעתו, המאמר ששלח התקבל לפירסום, וכך נולד תחום סטטיסטי חדש – הסטטיסטיקה האי-פרמטרית, וגם סטטיסטיקאי חדש.

11. ויליאם סילי גוסט (1876-1937)

ויליאם סילי גוסט

הסטטיסטיקאי שכמעט אף אחד לא שמע עליו, כולל בעלי תארים אקדמיים בסטטיסטיקה, אבל כ-ו-ל-ם מכירים. גוסט עבד במבשלות הבירה "גינס", ושם פיתח במסגרת עבודתו טכניקות סטטיסטיות שונות שעסקו בתכנון ניסויים וניתוח נתונים סטטיסטיים. את עבודותיו פרסם תחת הכינוי "סטודנט" בכתב העת ביומטריקה, הודות לקשריו הטובים עם העורך, קרל פירסון. את השיטה המפורסמת שפיתח להשוואת ממוצעים של שתי אוכלוסיות, מבחן t, מכיר כל מי שלמד קורס מבוא לסטטיסטיקה כלשהו.

10. דויד קוקס (נולד 1924)

דויד קוקס

סטטיסטיקאי אנגלי, נודע בעיקר בזכות תרומתו המכרעת לתחום של ניתוח נתוני השרדות (למשל, משך הזמן העובר עד שינוי במצבו הקליני של חולה). המודל של קוקס הוא סוס העבודה של ניתוח נתונים מסוג זה. תוצר לואי חשוב מאין כמוהו של מודל קוקס הוא שיטת אמידה חדשנית – "נראות חלקית" שמהווה אלטרנטיבה עמידה (רובסטית) לשיטת הנראות המירבית של פישר. הקוראים חדי העין שמו לב לדמיון בין שמו של קוקס ובין סטטיסטיקאי אנגלי אחר שנמצא ברשימה זו – ג'ורג' בוקס. השניים גם שמו לב לכך, והחליטו לכתוב מאמר משותף, פשוט כי מאמר שנושא את השמות בוקס-קוקס נראה להם משעשע (נסו להגיד "בוקס קוקס" עשר פעמים בקול רם בלי לצחוק). התוצאה הייתה מאמר חשוב שהגדיר, ניתח, והכניס לשימוש נרחב משפחה של טרנספומציות לנתונים, שנודעת מאז בשם טרנספומציית בוקס-קוקס.

9. ג'ון טוקי (1915-2000)

ג'ון טוקי

סטטיסטיקאי אמריקני זה היה "general practitioner". תופתעו אולי לשמוע שהוא זה שנמציא את המלים "ביט" ו-"software". אפשר לתאר כאן את עבודתו על טרנספומציות פורייה מהירות (FFT) ועל שיטת ה-jackknife, שהיא וריאציה של שיטת ה-bootstrap שפותחה מאוחר יותר על ידי ברדלי אפרון (שתשמעו עליו מייד). אבל טוקי נכנס לרשימה הזו בזכות גישת ה-"Exploratory Data Analysis" שפיתח וקידם. גישה זו דוגלת בהתבוננות בנתונים ואיתור תבניות בתוכם, בניגוד לגישה השלטת של "Confirmatory Data Analysis", שדוגלת בניסוח השערות ובדיקתן. ניתן לראות בשיטות כריית הנתונים (data mining) הפופולריות כיום כהרחבה של גישת טוקי, וללא ספק ההתפתחות העצומה בתחום מדעי המחשב סייעה לגישתו של טוקי להפוך לפופולרית ולגיטימית. מעניין לדעת האם טוקי חזה כל זאת כאשר עבד בשיתוף פעולה עם ג'ון פון ניומן בשנות הארבעים של המאה הקודמת.

8. ברדלי אפרון (נולד 1938)

ברדלי אפרון

אני נתקל בהרבה אנשים שמתייחסים לסטטיסטיקה כאל סוג של קסם, אבל אם יש שיטה סטטיסטית קסומה באמת, הרי זו שיטת ה-bootstrap שהגה ופיתח ברדלי אפרון מאוניברסיטת סטנפורד. חלקכם אולי מכירים את סיפורו של הברון מינכהאוזן, ששקע עם סוסו בבוץ טובעני. הברון רב התושיה וסוסו ניצלו מטביעה כאשר אחז הברון ברצועת המגף שלו עצמו ומשך את עצמו כלפי מעלה. תאמינו או לא, אבל בסטטיסטיקה הדבר אפשרי. אפרון הוכיח כי ניתן לאמוד מאפיינים סטטיסטיים של אמדים על ידי דגימה חוזרת ונשנית מתוך הנתונים שבידינו (שגם הם, מן הסתם, מהווים מדגם). כך נוצרת הדמיה (סימולציה) של מדגמים אלטרנטיביים שהיינו עשויים לראות. הטכניקה של אפרון עתירת מחשוב, והוצגה לראשונה בשנות השבעים של המאה הקודמת.

7. וו. אדוארדס דמינג (1900-1993)

ןן. אדוארדס דמינג

זהו אחד משני הסטטיסטיקאים ברשימה שלא היו חוקרים באקדמיה, השני הוא ויליאם גוסט. אך בעוד שגוסט עבד בחברה אחת, ונאלץ לפרסם את עבודותיו בעילום שם בגלל מדיניות החברה, דמינג סבב בעולם והרצה את הפילוסופיה הניהולית-סטטיסטית שלו שדגלה באבטחת איכות תהליכית באמצעים סטטיסטיים (תחום הידוע כ-SPC , Statistical Process Control). לכל מי שהיה מוכן לשמוע. מי שהקשיבו והפנימו היו היפנים, ודמינג נחשב לאחראי העיקרי לזינוק הטכנולוגי של יפן בשנות החמישים והשישים של המאה הקודמת.

6. קרל פרידריך גאוס (1777-1855)

קרל פרידריך גאוס

הרי אמרתי בדברי הפתיחה כי ברשימה יכללו אלה שיש להם השפעה ישירה על הסטטיסטיקה המודרנית, אז מה עושה כאן, ועוד במקום השישי, מתמטיקאי מהמאה ה-19? ובכן, לגאוס יש שתי השפעות כאלה: חלקו בגילוי משפט הגבול המרכזי ויישומיו, וכמובן, שיטת הריבועים הפחותים שפיתח. תוכלו לקרוא על שתי תרומות מכריעות אלה בהרחבה בשתי רשימות שפירסמתי כאן בעבר: למי צלצל הפעמון? וכן הכוכב הנעלם והאמד הכחול: משפט גאוס מרקוב ושיטת הריבועים הפחותים.

5. פלורנס נייטינגייל (1820-1910)

פלורנס נייטינגייל

נייטינגייל ידועה בציבור הרחב בעיקר כאחות, אך מדובר בסטטיסטיקאית חשובה, מחלוצות הביוסטטיסטיקה. "כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה, משום שזהו כלי המדידה של כוונותיו", אמרה נייטינגייל. היא הבהירה היטב את דבריה כאשר השתמשה בנתונים סטטיסטיים שאספה בקפדנות והציגה באמצעות שיטות שפיתחה כדי להוכיח כי שמירה על רמת סניטציה נכונה יכולה להוריד את שיעור התמותה בבתי החולים מ-80% ל-2% בלבד. על חייה של ניטינגייל ופועלה כתבתי כאן בהרחבה בעבר: הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל.

4. תומאס בייס (1702-1761)

תומאס בייס

תומאס בייס היה כומר אנגלי שחי לו במאה ה-18. בימי חייו הוא פרסם שני מאמרים בנושאים תיאולוגיים פילוסופיים, אך ככל הנראה התעניין גם במתמטיקה ובהסתברות. הסטטיסטיקה עוד לא נולדה בימיו. אז מה הוא עושה ברשימה הזו, ועוד במקום הרביעי? לאחר מותו של בייס פרסם ידידו, ריצ'רד פרייס, את אחד המכתבים ששלח אליו בייס. במכתב זה הראה בייס כיצד לחשב הסתברות מותנה "הפוכה" כאשר נתונה הסתברות מותנה. לא אכנס כאן לפרטים הטכניים (זה דורש רשימה נפרדת), אבל ההשלכות מהפכניות. בייס הראה כי במובן מסויים אין חשיבות לכיוון בו זורם הזמן – ניתן להסתכל על מאורעות בסדר בו הם מתרחשים או בכיוון ההפוך. אינטרפרטציה מיידית אחרת של התוצאה של בייס היא כי הסתברות אינה בהכרח אובייקטיבית אלא יכולה להיות תלויה ב"אמונות", כלומר בהנחות שמניחים על טבעו של העולם. על סמך אינטרפרטציה זו נבנה ענף שלם וחדש של הסטטיסטיקה – שנקרא, איך לא – סטטיסטיקה בייסיאנית. הניצנים של ענף זה החלו להופיע בשנות החמישים של המאה העשרים, והסטטיסטיקה הבייסיאנית כובשת לה אט אט עוד מעריצים.

3. ג'רזי ניימן (1894-1981)

ג'רזי ניימן

על ג'רזי ניימן וחלק מפועלו כבר כתבתי כאן בהרחבה ברשימה "בין שתי טעויות", שתיארה את התהליך של בדיקת השערות/קבלת החלטות, ואת הלמה של ניימן ופירסון, שהראתה כיצד ניתן לבנות כלל החלטה אופטימלי. למה זו היא ללא ספק המשפט השימושי ביותר בסטטיסטיקה, ורק היא לבדה מקנה לבעליה חיי נצח סטטיסטיים. בכל זאת, אני מציב במקום השלישי את ניימן לבדו, ודוחק מהרשימה את שותפו אגון פירסון (בנו של קרל פירסון). מעניין לציין כי הלמה של ניימן ופירסון דחקה את מתודולוגיית בדיקת ההשערות ששלטה עד אז בכיפה – המתודולוגיה של קרל פירסון, שניימן עבד בשיתוף פעולה עימו במשך כשנתיים. מי שלא אהב כלל לשתף פעולה עם ניימן היה רונלד פישר. הסיבה – שניהם הציגו שיטות לאמידה מרווחית של פרמטרים, כלומר שיטה למצוא תחום שהפרמטר נמצא בתוכו ברמת בטחון מסויימת. ניימן הציע את רווח הסמך – Confidence interval, בעוד שפישר הציע את הגבולות המהימנים – Fiducial limits. פישר כעס על ניימן כי חשב שגנב ממנו את הרעיון. אכן, במקרים מסויימים שתי השיטות נתנו את אותה התוצאה בדיוק. אולם, שיטתו של ניימן עדיפה על זו של פישר, כיוון שהיא מגובה בלמה שלו ושל פירסון, ולכן היא אופטימלית. פישר לא השתכנע עד יום מותו. השיטה שפיתח עדיין בשימוש במקרים בהם לא ניתן להפעיל את שיטתו של ניימן.

2. קרל פירסון (1857-1936)

קרל פירסון

קרל פירסון הוא הראשון שממש נשא בתואר "סטטיסטיקאי". הוא יסד את המחלקה לסטטיסטיקה האקדמית הראשונה בעולם, ביוניברסיטי קולג' שבלונדון, ואת כתב העת הראשון שעסק בסטטיסטיקה בלבד – ביומטריקה. תרומותיו העיקריות לסטטיסטיקה הן בפיתוח התיאוריה של הרגרסיה הלינארית (שיסודותיה הונחו, כזכור, על ידי גאוס שהמציא את שיטת הריבועים הפחותים), פיתוח מקדם המתאם, עבודתו במיון וסיווג ההתפלגויות הסטטיסטיות השונות, ופיתוח מבחן טיב ההתאמה (שידוע גם בשם "מבחן חי-בריבוע").

1. רונלד פישר (1890-1962)

רונלד פישר

לו ניתנה לי הזדמנות לפגוש באדם אחד אשר אינו בין החיים היום, האדם אותו הייתי בוחר לפגוש היה רונלד פישר. פישר למד אסטרונומיה בקיימברידג´, והתעניין במיוחד בהערכת הטעויות בחישובים אסטרונומיים. לאחר סיום לימודיו עסק מספר שנים בהוראת מתמטיקה, וב-1919 עזב את ההוראה לטובת משרת מחקר בחווה לניסויים חקלאיים, שם עסק בניסויים גנטיים. עבודתו בחווה הוליכה אותו אל העיסוק בסטטיסטיקה, שהייתה אז ענף זנוח של המתמטיקה. במסגרת עבודתו היה עליו לתכנן ניסויים ולנתח את תוצאותיהם – שני השלבים הקריטיים בכל מחקר המתבסס על איסוף נתונים ועיבודם. במשך שנות עבודתו בחווה הניח פישר את היסודות לסטטיסטיקה המודרנית. הוא הגה ופיתח את שיטת הרנדומיזציה לתכנון ניסויים, ואת ניתוח השונות (ANOVA), כלים יסודיים ומרכזיים בסטטיסטיקה המודרנית. פישר הדגיש כי שלב התכנון הוא השלב הקריטי ביותר בכל ניסוי. "לקרוא לסטטיסטיקאי לאחר שהניסוי הסתיים זה כמו לקרוא לרופא לאחר שהחולה מת", אמר פישר. "לכל היותר יוכל הסטטיסטיקאי לומר מדוע הניסוי נכשל". כמו כן הגה פישר מושג מרכזי נוסף בסטטיסטיקה – מושג הנראות (Likelihood) וממנו פיתח את שיטת האמידה הידועה כשיטת הנראות המקסימלית. פיתוחים מרכזיים נוספים שלו כללו שיטות סטטיסטיות לניתוח מדגמים קטנים, וחישובי פונקציות ההתפלגות המדויקות של מדדים סטטיסטיים רבים. חלק מעבודתו של פישר נתקל בביקורת מצידו של בכיר העוסקים בסטטיסטיקה באותה תקופה, קרל פירסון, שהתנגד במיוחד למושג הנראות ושיטת הנראות המירבית. פישר, בתגובה, פירסם מאמר ובו הצביע על טעויות באחת מעבודותיו של פירסון. היריבות בין השניים נמשכה עד מותו של פירסון, ולמעשה גם אחריה, כאשר בנו של קרל פירסון, סטטיסטיקאי נודע בזכות עצמו, המשיך לריב את ריבו של אביו. נצחון בעל משמעות סמלית נחל פישר כאשר התמנה לכהן בקתדרה על שם גאלטון בקיימברידג´ במקום פירסון, כאשר האחרון פרש לגמלאות (העלבון כפול, כי פירסון היה כזכור תלמידו של גאלטון). גם בראיה היסטורית, ניצח פישר בויכוח עם פירסון ובנו. הוא זכה להכרה בהישגיו כאשר נבחר לחברה המלכותית, זכה בפרסים רבים, כולל מדליית דרוין, וכן הוענק לו תואר אצולה. פישר פרסם מאמרים רבים הן בסטטיסטיקה והן בגנטיקה. נציין כאן את שני ספריו החשובים ביותר: "שיטות סטטיסטיות למחקר", בו סיכם את תרומותיו לסטטיסטיקה, ו-"תיאוריה גנטית של הברירה הטבעית", בו סיכם את מחקריו בתחום הגנטיקה.

הקוראים הותיקים של הבלוג הזה בודאי זוכרים את האנקדוטה אודות פישר שסירב להשתכנע כי עישון גורם לסרטן על סמך מתאם שנצפה בין שתי התופעות (ראו את הרשימה הראשונה שפירסמתי: האם החסידה מביאה ילדים לעולם?), נאמן לעקרון הסטטיסטי לפיו מתאם אינו מעיד על סיבתיות. פישר, מעשן כבד כל חייו, מת לאחר שחלה בסרטן המעי הגס בשנת 1962.

נשלח: 12 באפריל, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה.
תגובות: 15 | טראקבק

כאב ראש תורכי

מי שחטף כאבי ראש בעקבות הזעזועים בשווקי המטבע הבינלאומיים שהיו בשנה האחרונה, ישמח אולי לדעת שזו לא תופעה חדשה.

אסף ברטוב מדווח בבלוג של פרוייקט בן יהודה על תנודות שער החליפין של הלירה התורכית בתקופת האימפריה העות'מנית, כפי שתוארו בספרו של יהושע ילין, "זכרונות לבן ירושלים" (להלן ציטוט קצר מהקטע המלא שהביא אסף):

"הלירה היא לפעמים מאה ועשרים גרוש, ולפעמים יותר או פחות; וכן שונה מחירה בכל עיר ועיר: בירושלים מאה ועשרים, וביפו מאה וארבעים וכו'; וכן שאר המטבעות משתנות ומתחלפות."

אין חדש תחת השמש.

נשלח: 26 בינואר, 2009. נושאים: היסטוריה, הממ... מעניין....
תגובות: 2 | טראקבק

הכוכב הנעלם והאמד הכחול: משפט גאוס מרקוב ושיטת הריבועים הפחותים

שמחה גדולה אחזה בעולם האסטרונומיה בשנת 1781, עם גילויו של כוכב הלכת אוראנוס. לאחר שכוכב לכת זה נצפה, מסלולו חושב ומרחקו מהשמש הוערך, התברר כי מרחקו מהשמש מתאים לתחזית של "חוק טיטיוס-בודה", מעין להטוט חשבוני (שגוי, כך התברר בדיעבד) המתאר את מרחקו של כוכב לכת מהשמש כפונקציה של מספרו הסידורי. החוק תיאר בצורה טובה את מרחקיהם של כל כוכבי הלכת שהיו חדועים עד אז, אך השאיר "חור" בין מאדים לצדק. לפי החוק, "צריך" היה להיות שם עוד כוכב לכת, שלא נתגלה עדיין.

האסטרונומים הפנו את מאמציהם לגילוי כוכב הלכת האבוד. המאמץ נשא פרי כעבור 20 שנה. באחד בינואר 1801 גילה האסטרונום האיטלקי ג'וזפה פיאצי גוף שמימי שנע במסלול המיועד לכוכב הלכת האבוד. הוא כינה כוכב לכת חדש זה בשם צרס, לכבוד אלת החקלאות הרומית.

שמחתם של פיאצי ועמיתיו הייתה קצרה. לאחר שצפו בצרס במשך 41 לילות, "התקרב" מסלולו אל השמש, ובשל אורה החזק לא יכלו המשיך ולצפות בו. כמובן, כאשר יסיים צרס את הקפתו ויופיע מצידה השני של השמש יוכלו לצפות בו שוב, אבל, היכן בדיוק יופיע בשמי הלילה? הנתונים המועטים שנצברו (רק 22 תצפיות בפועל נאספו במשך 41 הלילות) לא אפשרו חישוב מדוייק של מסלולו.

מספר מלומדים ניסו לחזות את מסלולו של הכוכב הסורר. אחד מהם היה קרל פרידריך גאוס, מתמטיקאי ואסטרונום מהאוניברסיטה של גטינגן (אני מניח שכבר שמעתם עליו אי אלו פעמים). גאוס פרסם את תחזיתו למסלול של צרס בספטמבר 1801. צרס ציית לתחזיותיו של גאוס, והופיע בשמים בהתאם. עם גילוים של אסטרואידים נוספים שנעו במסלול בין מאדים לצדק, חזר גאוס על התרגיל וחישב את מסלולם של רבים מהם.

שרטוט המסלולים של האסטרואידים צרס ופאלאס על ידי גאוס (מקור: http://www.math.rutgers.edu/~cherlin/History/Papers1999/weiss.html)

מה היה הסוד של גאוס? רק ב-1809 פרסם גאוס ברבים את שיטתו, הידועה כיום כשיטת הריבועים הפחותים. ככל הנראה, גאוס נכנע ופרסם את השיטה רק לאחר שהמתמטיקאי הצרפתי לז'נדר פרסם בשנת 1806 את שיטתו לחישוב מסלולי שביטים, ולמעשה הוא שטבע את שם השיטה :"Méthode des Moindres Quarrés ". עם זאת, ידוע כי גאוס הכיר את השיטה כבר ב-1795, והוכיח ב-1798 כי אמד הריבועים הפחותים הוא אמד נראות מירבית – Maximum Likelihood Estimator (כמובן, המושגים האלה, שלקוחים מתחום התיאוריה הסטטיסטית, עדיין לא היו ידועים בימיו). ב-1823 הוכיח גאוס כי השיטה אכן מספקת את האמד הלינארי הטוב ביותר במובן שזהו האמד הלינארי חסר ההטיה ששונותו מינימלית. מכאן הופיע הביטוי "אמד כחול" בכותרת הרשימה. כחול – BLUE- הם ראשי התיבות של Best Linear Unbiased Estimator. אין צורך להבהל מהמונחים הטכניים האלה, שלא אסביר בפירוט. אומר רק כי במלים פשוטות, גאוס הוכיח כי השיטה אופטימלית בשלושה מובנים שונים – גם נראות מירבית, גם שונות מינימלית וגם חסר הטיה.

גאוס (משמאל) ומרקוב חולקים בתהילה של שיטת הריבועים הפחותים

המתמטיקאי הרוסי אנדריי אנדרייביץ מרקוב, שידוע בעיקר בזכות תרומתו לחקר התהליכים המקריים, תיאר בפירוט את שיטת הריבועים הפחותים בספר שפרסם ב-1912, וניסח אותה מחדש באופן ברור יותר, ובכך תרם את תרומתו להפצתה של השיטה ולפיתוחה. בזכות תרומתו זו זכה לחלוק בתהילה עם גאוס, והמשפט המוכיח את האופטימליות של שיטת הריבועים הפחותים נקרא משפש גאוס-מרקוב.

השיטה והכללותיה משמשות עד היום ככלי מרכזי לניתוח סטטיסטי של נתונים, ונמצאת בשימוש גם במדעים המדוייקים וגם במדעי החברה, בעיקר בתחום הכלכלה. סטיבן לויט, מחבר הספר רב המכר "פריקונומיקס", כתב בספרו כי השימוש בשיטה הוא "יותר אמנות מאשר מדע". אני חולק על דבריו. זוהי שיטה מדעית, המבוססת על תיאוריה מתמטית. יש לה יתרונות עצומים, כמובן, אך גם מגבלות. המשתמש בה חייב תמיד להיות מודע למגבלות האלה, ולא, מסקנותיו יהיו שגויות.

עד כאן ה"ציונות". אבל מהי בעצם שיטת הריבועים הפחותים? אנסה כעת לתת הסבר שווה לכל נפש.

נניח כי יש בידינו קבוצת נתונים, שנאספה ממדגם כלשהו. לכל פרט במדגם יש שני נתונים כמותיים. לדוגמא, אם אנו מסתכלים על מדגם של כפרים, נתון אחד יכול להיות מספר החסידות שקיננו בכפר באביב, והנתון השני יכול להיות מספר הלידות שהיו בכפר בקיץ שלאחר מכן. כלכלנים יעדיפו אולי להסתכל על מדגם של מדינות, כאשר נתון אחד הוא גובה המס שמטילה ממשלת המדינה על העסקים בתחומה, והנתון השני הוא הכנסות הממשלה ממסים באחוזים מהתמ"ג. חוקרים בחברת תרופות יסתכלו על מדגם של חולים, ויאספו נתונים על מינון התרופה הנסיונית שניתן לכל חולה ועל השינוי במצבו. בכל מקרה, אפשר לשרטט את הנתונים שהתקבלו על מערכת צירים, ומתקבלת דיאגרמת פיזור (scatterplot). בשרטוט אנו רואים מדגם בגודל עשרה כפרים. הנקודה המסומנת בחץ, לדוגמא, מייצגת כפר במדגם בו קיננו עשר חסידות ונולדו שני תינוקות (הנתונים לא אמיתיים, כמובן, אלא נדגמו ממוחי הקודח):

נניח שאנו רוצים לגלות האם קיים קשר קווי בין שני המשתנים. במלים אחרות, אנו שואלים את עצמנו האם ניתן לשרטט על מערכת הצירים קו שיתאר את הקשר בין המשתנים? כמובן שאי אפשר לשרטט קו ישר שיעבור דרך כל 10 הנקודות, אבל ישנם הרבה (אינסוף) קוים שעוברים דרך "ענן" הנקודות שלנו. שרטטתי כמה מהם על פני מערכת הצירים. איזה מהם מתאר את הקשר בין שני המשתנים בצורה הטובה ביותר?

הנה הרעיון של גאוס. הוא בחר קו ישר אחד, ומדד את המרחק האנכי מכל נקודה אל הקו. סימנתי את המרחק האנכי מכל נקודה אל הקו על השרטוט שלנו. בכפר הראשון, בו קיננו 2 חסידות והיו 10 לידות, המרחק האנכי (כלומר אורך הקו האדום) הוא בערך 5. בכפר השני, בו קיננו 3 חסידות והיו 5 לידות, אורך הקו האדום הוא בערך 0.5, אבל כיוון שהנקודה נמצאת מתחת לקו, המרחק האנכי הוא 0.5-.

הקו האידיאלי הוא זה שעבורו כל המרחקים האנכיים שוים לאפס, אבל קו כזה לא קיים בדרך כלל. לכן אין ברירה אלא לחשב את הקו האופטימלי. אפשר, למשל, לחפש את הקו שעבורו סכום המרחקים בערכיהם המוחלטים הוא מינימלי. גאוס הבין כי עדיף לחפש את הקו שעבורו סכום ריבועי המרחקים הוא מינימלי (מכאן השם "ריבועים פחותים" – "Least Squares"). גאוס גם הראה כיצד ניתן למצוא את הקו האופטימלי. כל קו ישר ניתן לאפיון מלא על ידי שני פרמטרים – שיפועו ונקודת החיתוך שלו עם הציר האנכי. לכן ניתן לרשום את סכום ריבועי המרחקים האנכיים כפונקציה של שני הפרמטרים האלה, ולמצוא את נקודת המינימום של הפונקציה. ניתן לעשות זאת על ידי שימוש בחשבון דיפרנציאלי או תוך כדי שימוש בשיקולים גיאומטריים/אלגבריים. אפשר לחשב ולמצוא כי הקו האופטימלי לנתונים שבדוגמא הוא:

ניתן לפרש זאת בערך כך: גם ללא חסידות יהיו בממוצע 6.8 לידות, וכל חמש (בערך) חסידות נוספות יביאו ללידת תינוק נוסף. אינטרפרטציה מפתה נוספת היא אינטרפרטצית הניבוי: מה יקרה בכפר בו יקננו 20 חסידות? אם נציב 20 בנוסחא, קו הריבועים הפחותים ינבא כי יהיו בכפר זה 10.6 לידות.

אבל, אבוי, קו הריבועים הפחותים אינו מאפשר ניבוי אמיתי. הפרמטרים הנאמדים (שהם כזכור שיפוע הקו ונקודת החיתוך שלו עם הציר האנכי) תלויים ישירות במקדם המתאם בין שני המשתנים. קו הריבועים הפחותים מתאר קשר אפשרי בין המשתנים, אבל לא סיבה ותוצאה. גם אם היינו מחליפים את תפקידי המשתנים, כמספר הלידות הוא המשתנה ה"מסביר" את מספר החסידות (כמשתנה ה"מוסבר"), מקדם המתאם בין שני המשתנים לא היה משתנה, וההסבר לפיו מספר החסידות מנבא את מספר הלידות הגיוני בדיוק כמו ההסבר לפיו מספר הלידות מנבא את מספר החסידות.

זאת ועוד: קו הריבועים הפחותים מתאר רק את מה שקורה בתחום הערכים בו צפינו. הוא לא יכול לומר לנו שום דבר על מהות הקשר בין המשתנים מחוץ לטווח הזה. במלים אחרות: קו הריבועים הפחותים הוא מודל תיאורי של הנתונים, וככזה הוא מוגבל להסברה של הנתונים המתוארים ותו לא. המציאות עשויה להיות שונה. באיור הבא מובאות ארבע דיאגרמות פיזור שמצאתי באינטרנט, עם קוי הריבועים הפחותים שהיו עשויים להתקבל לו הייינו מסתכלים רק על טווח חלקי של הנתונים:

קו הריבועים הפחותים מול המציאות - ארבע דוגמאות

גאוס הצליח בניבוי המסלול של צרס בעזרת קו הריבועים הפחותים כיוון שהסתבך על מודל מוצק, לפיו צרס (כמו שאר כוכבי הלכת) מקיף את השמש במסלול אליפטי. לאחר שיש מודל, הכלים הסטטיסטיים יכולים לאפשר את אמידת הפרמטרים שלו. ההיפך לא בהכרח נכון. ניתן להשתמש בכלים הסטטיסטיים כדי לתאר את הנתונים, אך אין די בכך כדי לבנות ולאשר מודל. לצערנו, ישנם אנשים שבכל זאת בונים מודל סביב הנתונים הסטטיסטיים שלהם, מבלי להתחשב במגבלות של כלי הרגרסיה.

נשלח: 1 בינואר, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, המשפטים הגדולים של הסטטיסטיקה, מה אומרת הסטטיסטיקה.
תגובות: 14 | טראקבק

מי בעד חיסול התלושים?

מאמר מעניין שהופיע בסופ"ש במוסף "הארץ" תחת הכותרת "מי בעד חיסול התלושים?", מספר על ההיסטוריה של סקרי דעת הקהל בישראל:

"סקרי דעת קהל הם באמת יבוא מאמריקה, אבל נמצאים איתנו כבר יותר מ-60 שנה. "מפתיע לגלות שחקר דעת הקהל בישראל קדם להקמת המדינה", כתבה ד"ר דנה בלאנדר, חוקרת במכון הישראלי לדמוקרטיה, במאמר שהתפרסם באתר של המכון. החלוץ של המחקר החברתי-שימושי בארץ היה פרופ' אליהו (לואיס) גוטמן, שממניעים ציוניים ויתר על קריירה אקדמית בארצות הברית ובא ארצה ביולי 47'. כעבור חצי שנה, בעיצומה של מלחמת העצמאות, יחד עם אוריאל פואה, חוקר במדעי החברה שבא מאיטליה, הקים גוטמן בירושלים יחידת מחקר פסיכולוגית קטנה, שהורכבה ממתנדבים ועסקה בחקר דעת קהל בשביל מחלקת ההסברה של "משמר העם"."

פורסם לראשונה באתר "רשימות" בתאריך 17 באוגוסט 2008

נשלח: 8 בדצמבר, 2008. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

מילטון פרידמן, אוגוסטו פינושה, מוחמד יונוס

כאשר הלך פרופ' מילטון פרידמן לעולמו, לפני כשלושה וחצי שבועות, מלאו העיתונים במאמרי הספד לרוב. אני נמנעתי מלכתוב על כך. ומה הייתי יכול להוסיף על כל המלים שהרעיפו עלינו טובי הכותבים? פרידמן, אדם רב השפעה ושנוי במחלוקת, היה לדעתי יותר נביא מאשר איש מדע. המלים הבלתי נשכחות שאמר לסבר פלוצקר בראיון בשנת 2002: "צדקתי אז, צדקתי מאז ואני צודק כעת. איני רואה סיבה לשנות את דעותיי" אומרות את הכל – פרידמן ראה את האור בשנות הששים, ומאז שוב לא הרגיש צורך לבחון את דעותיו. מתנגדיו זכו בפרס נובל לכלכלה לפניו וגם אחריו: פול סמואלסון, אמרטיה סן, דניאל כהנמן הם מהבולטים שבהם, וגם תומכיו זכו בפרסי נובל: ג'ון נאש וישראל אומן למשל. מה זה אומר? זה אומר בעיקר שהכלכלה אינה מדע מדוייק, וכי גדולי הכלכלה אינם מסכימים בינם ובין עצמם על הנחות היסוד של המדע הזה.

שתי סיבות גרמו לי להזכיר היום את פרידמן. באוסלו הוענק אתמול פרס נובל לשלום דווקא, לכלכלן איש בנגלדש, מוחמד יונוס. יונוס אמנם קפיטליסט מתון בדיעותיו, אך בניגוד לפרידמן אינו סבור כי עלינו להפקיר את גורלנו לחסדי היד הנעלמה. יונוס הושיט יד נוספת, בנק גראמין, שאפשרה לאלפי עסקים קטנים בבנגלדש להתפתח. תוכלו לקרוא עוד על יונוס ופועלו בבלוג של יונית, ואסתפק כאן רק בציטוט של עיקרי דבריו בנאום קבלת הפרס: "העוני הוא איום על השלום. התסכולים, העויינות והכעס שנובעים מעוני משפיל לא יכולים לתרום לשימור של שלום באף חברה בעולם… באמצעות הגדרת היזם בצורה רחבה יותר אנו יכולים לבצע שינוי רדיקלי באופיו של הקפיטליזם, ולפתור רבות מהבעיות החברתיות והכלכליות הבלתי פתורות בתוך המסגרת של השוק החופשי… יש לפתח מנגנונים חדשים כדי להתמודד עם אי השוויון העצום בחלוקת העושר… לא ניתן להשיג שלום אמיתי ומתמשך אלא אם קבוצות אוכלוסיה גדולות ימצאו דרכים להיחלץ מהעוני. מיקרו-קרדיט הוא דרך כזו. יוזמות כמו זו מקדמות את הדמוקרטיה ואת זכויות האדם… אני מאמין שהשקעת משאבים בשיפור חייהם של אנשים עניים היא אסטרטגיה טובה יותר מאשר להשקיע את הכסף ברובים". אם העולם הבא קיים, אני מקווה שמילטון פרידמן הקשיב.

והנה הסיבה השניה לכתוב על מילטון פרידמן היום. אמנם מי שהיה שר האוצר של ישראל, שמחה ארליך, ניסה ליישם כאן את רעיונותיו של פרידמן, לא בהצלחה רבה, אולם המדינה בה יושמו רעיונות אלה באופן העקבי ביותר הייתה צ'ילה. ובכן, שבועות אחדים אחרי שהלך פרידמן לעולמו, הלך אתמול לעולמו האיש שיישם את עקרונות הכלכלה של פרידמן בצ'ילה, אחרי שתפס את השלטון במדינה בהפיכה צבאית בשנת 1973: הגנרל אוגוסטו פינושה. יואב קרני מציין בבלוג שלו כי לזכות פינושה "אין מנוס מלזקוף את השיקום המזהיר של כלכלת צ'ילה". (הכלכלה המזהירה של צ'ילה מפיקה כיום, דרך אגב, תמ"ג של 4420 דולר לנפש. קצת פחות מלבנון, קצת יותר מפולין). את מחיר השיקום נמנע קרני מלציין: ביטול שכר המינימום והזכות לאיגוד מקצועי, הפרטת קרנות הפנסיה, תעשיות בבעלות ממשלתית ובנקים, והפחתת מיסים על רווחים ועל הון, תוך כדי הטבה עם השכבות העשירות ופגיעה קשה במעמדות הנמוכים ובמעמד הביניים. אם העולם הבא קיים, אני משוכנע שפרידמן ופינושה ייפגשו שם. מעניין על מה הם ידברו.

פורסם לראשונה באתר "רשימות" בתאריך 11 בדצמבר 2006 שם התקבלו 11 תגובות

באנדר בתאריך 12/11/2006 8:37:40 PM

לבחון את פינושה מהזוית הכלכלית

זאת פרובוקציה.
מחר יבוא מי שיטען שהיטלר הבריא את כלכלת גרמניה.

אייל גרוס [אתר] בתאריך 12/11/2006 8:40:38 PM

פינושה

והיה גם מחיר של עינויים, העלמויות, מוות
http://www.notes.co.il/gross/26332.asp
http://www.notes.co.il/gross/26336.asp

הצועד בנעליו [אתר] בתאריך 12/11/2006 8:47:52 PM

אם העולם הבא קיים

השרץ כבר הגיעה אל הכירה הממתינה לו שם, ללא תחנות.

הצועד בנעליו [אתר] בתאריך 12/11/2006 8:48:28 PM

הגיע. סליחה.

אורי פז [אתר] בתאריך 12/11/2006 8:48:33 PM

ללא כותרת

אין זה מדויק לומר שמתנגדי מילטון פרידמן "זכו בפרס נובל לכלכלה *לפניו* וגם אחריו", ולו משום שפרידמן היה ראשון מקבלי פרס נובל לכלכלה. לפניו לא הוענק הפרס לאיש בתחום חקר הכלכלה.
ויותר משהזכיות שאתה מונה לכלכלנים המגוונים מעידות על אופיו של מדע הכלכלה, הן מעידות בעיני על אופיו של פרס הנובל. לפיו, כל מי שתרם להתפתחות האנושות והצעידה קדימה ראוי לפרס בתחום תרומתו. שלא לדבר על הפוליטיזציה של פרס נובל.

יוסי לוי [אתר] בתאריך 12/11/2006 11:52:10 PM

תשובה לאורי פז

אורי, אתה פשוט טועה.
פרס נובל לכלכלה מוענק החל מ-1969, והזוכים הראשונים בפרס היו ההולנדי יאן טינברגן והנורווגי ראגנר פריש. פול סמואלסון, מגדולי מתנגדיו של פרידמן זכה בפרס ב-1970. עוד 8 כלכלנים זכו בפרס בשנים 1971-1975, ובינהם גונאר מירדאל, מאבות מדינת הרווחה השוודית, שזכה בפרס ב-1974. לפרידמן הפרס הוענק ב-1976.
רשימה מלאה של כל הזוכים נמצאת באתר מוסד נובל: http://nobelprize.org/nobel_prizes/economics/laureates/

מתן בתאריך 12/12/2006 12:47:43 PM

מילטון םרידמן כלכלה ומיקרו קרדיט

הערה קטנה בקשר למיקרו בנקינג ומילטון פרידמן
מיקרו בנקינג דבר מבורך הוא ומצויין ואפילו מגזין האקונומיסט ממהללי מילטון מברך ומצדיק אותו. אני לא בטוח שלמילטון עצמו הייתה בעיה איתו כי בסוף מה שהמיקרו בנקינג עושה וזאת יודע כל סטודנט שנה א לכלכלה הוא יוצר שוק משוכלל שמורכב מעשרות עסקים קטנים דבכר שגורר שוק חופשי ולא להפך.
המיקרו בנקס ברובם הינם מיזמים פרטים ולא ממשלתיים ולכן "מוקש נוסף " נוטרל.
דבר נוסף הוא כמובן אמירה שהוא אנטי עזרה לעניים הוא לא אומר את זה הוא אומר שהוא לא רואה למה הכסף שלו שבה מעבודה קשה צריך לממן את העני (אני לא מביע במקרה זה דעה גישתו קיצונית) דבר שאנו רואים היום כבעיה חמורה בעולם המערבי עם זה
MEDCARE או תוכניות דומות לה
הכלכלה מעניקה לנו כלים מה אנחנו עושים איתם זה החלטה שלנו בלבד לא של הכלכלה
זה שארהב החליטה להגיע לירח לא שינה את חוקי הפיזיקה הם היו לפני וישערו אחרי
הכלכלה עוזרת לנו להבין מהן העלויות של ההחלטות האלו!

עומר בתאריך 12/12/2006 5:06:58 PM

מהיכן אתה יודע

שנאש הוא מתומכיו של פרידמן? נאש זכה בפרס בשל התרומה העצומה של התוצאה שלו למספר ענפים בכלכלה (ובעיקר בשל הלחץ הלא ממש מתון מצידו של אריאל רובינשטיין…). כיצד אתה מסיק מכך שהוא מתומכי פרידמן?

יוסי לוי [אתר] בתאריך 12/13/2006 12:36:35 AM

תשובה לעומר

נאש זכה בפרס נובל בזכות תרומתו לפיתוח תורת המשחקים, שבבסיסה עומדת הנחת הרציונליות של הפרט, והנחה זו היא גם אחת מהאקסיומות שהתיאוריה של פרידמן נבנית עליהן.
אולי היה מוגזם לכלול אותו ברשימת תומכי פרידמן, אבל ללא ספק, שניהם נשענים על אותו בסיס.

עומר בתאריך 12/14/2006 10:55:28 AM

אני עדיין לא משוכנע

אותו בסיס? נאש לקח מודל מסויים של משחקים לא שיתופיים והציג תוצאה מסויימת שתקפה בו. המודל אכן מניח הנחת רציונליות חזקה למדי. אבל מכאן ועד האמירה שהוא ופרידמן נשענים על אותו הבסיס יש מרחק רב מאוד…

עומר בתאריך 12/14/2006 11:04:22 AM

עניין נוסף

התמ"ג לנפש בצ'ילה אינו 4420 דולר כפי שכתבת אלא כ-11900 דולר (לפי נתוני שנת 2005).

נשלח: 6 בדצמבר, 2008. נושאים: היסטוריה, כלכלה וחברה, על סדר היום.
תגובות: אין | טראקבק

כמה טנקים יש לחיזבאללה?

אני מקווה שלחיזבאללה אין אף לא טנק אחד. אבל השאלה "כמה טנקים יש לאויב?" נשאלה בכובד ראש במלחמת העולם השניה, והאויב במקרה הזה הייתה גרמניה הנאצית.

הטנקים ששימשו את גרמניה במלחמה מדגם "פאנצר" היו נחותים טכנולוגית לעומת הטנקים של בעלות הברית, אבל בתחילת 1943 המצב השתנה. הגרמנים הכניסו לשימוש דגם חדיש ומשופר, שכונה "פאנצר V". דגם משופר זה העמיד את בנות הברית בפני שאלות רבות, ובינהן גם השאלה הפשוטה: "כמה טנקים כאלה יש לגרמניה?". שאלה לא פחות חשובה הייתה מהו קצב הייצור של הטנקים האלה. זרועות המודיעין הבריטית והאמריקנית ניסו לענות על שאלות אלה באמצעות תצפיות אל אתרי הייצור וספירת טנקים בשדה הקרב, אך ההערכות שהתקבלו היו סותרות ובלתי מהימנות.

אבל כאשר הצליחו בעלות הברית לקחת שלל 5 טנקים, נפל בידם מידע רב ערך שאפשר להם לענות על השאלות האלה. הבריטים גילו כי על כל טנק הופיע מספר. מה משמעות המספר הזה? בהכירם את הגרמנים, אנשים מסודרים, הניחו הבריטים האלה כי אלה מספרים סידוריים שניתנו לטנקים על פי סדר ייצורם. הטנק הראשון שיוצר זכה למספר 1, השני למספר 2, וכן הלאה. אם זהו המצב, הרי שהמפתח לפתרון הוא סטטיסטי.

אסביר את העניין באמצעות דוגמא (המספרים לא אמיתיים). נניח שחמשת הטנקים שנתפסו נשאו את המספרים הסידוריים הבאים: 53, 13, 84, 109, ו-26. ברור כמובן שיוצרו לפחות 109 טנקים. אבל אפשר להסיק יותר מכך.
חמשת הטנקים שנתפסו הם מדגם (מייצג, יש לקוות) של כל הטנקים שייוצרו. לכל טנק יש מפר סידורי, והמספרים הסידוריים של הטנקים הם: N,…,1,2 כאשר N הוא מספר הטנקים שיוצרו עד כה. כיצד נאמוד את N? יש מספר דרכים לעשות זאת. אני מציע לכם הקוראים לחשוב קצת ולנסות לאמוד את N בעצמכם. אציג כאן שלוש דרכים אפשריות לאמוד את N.

הדרך הראשונה מבוססת על שימוש בממוצע. אם יוצרו N טנקים, הרי שלטנק הממוצע יש מספר סידורי השווה ל-2/(1+N). לעומת זאת, המספר הסידורי הממוצע של חמשת הטנקים שנתפסו הוא 57. אם נשווה בין הממוצע התיאורטי ובין ממוצע המדגם נקבל:

על פי שיטה זו, האמדן למספר הטנקים שיוצרו הוא 115.

דרך אפשרית אחרת היא להשתמש במרווחים שבין מהספרים. הסידוריים. זכרו כי אנו יודעים את מספרו של טנק נוסף – הטנק הראשון שיוצר שמספרו 1. נרשום את המספרים הסידוריים לפי הסדר:

המרווחים שבין המספרים הם:

(12 הוא המרווח בין 1 ל-13, 13 הוא המרווח בין 13 ל-26, וכולי). את המרווח האחרון, N-109, אפשר לאמוד באמצעות ממוצע חמשת המרווחים הראשונים (25, 31, 27, 13, 12) השווה ל-21.6 ולקבל כי האמדן ל-N יהיה 109+21.6, או 131 (לאחר עיגול).

ניתן לראות את החישוב הזה גם באופן הבא: בין שבעת המספרים הסידוריים (5 מספרי הטנקים שנתפסו, 1 ו-N) יש ששה מרווחים. לכן המרווח בין 1 ל-N שווה ל-6 פעמים המרווח הממוצע. מכאן ש-

ולכן שוב נקבל כי האמדן ל-N הוא 131.

שימו לב כי את המרווח הממוצע ניתן היה לחשב בלי לחשב את חמשת המרווחים בנפרד. המרווח הממוצע הוא למעשה 5/(109-1), וערכו תלוי רק במספר הסידורי המקסימלי שנצפה – נסמן אותו באות M, ובגודל המדגם, (כיוון שככל שגודל הדגם גדול יותר, כך רב הסיכוי כי נצפה במספר סידורי גדול יותר). למעשה, כל האינפורמציה הרלוונטית למספר הטנקים שיוצרו מרוכזת בנתון הבודד M. טענה זו ניתנת לניסוח מתמטי ולהוכחה.
תיקון קל לחישוב האחרון יביא לאמדן הסטטיסטי האופטימלי עבור N (שוב, ניתן להוכיח את האופטימליות של הנוסחה הבאה):

ובדוגמה שלנו:

לאחר שנפתרה הבעיה של אמידה מספר הטנקים שיוצרו עד כה, ניתן בקלות לחשב את קצב הייצור. כל מה שצריך זה להמתין חודש, לאסוף עוד נתונים, ולחזור על החישוב.

מיותר לציין, אך אומר בכל זאת: בסיום המלחמה, כאשר נתפסו בתי החרושת בהם יוצרו הטנקים – הובהר כי האמדנים הסטטיסטיים שהתבססו על המספרים הסידוריים היו מדוייקים בהרבה מהאמדנים שהתבססו על התצפיות המודיעיניות.

פורסם לראשונה באתר "רשימות" בתאריך 29 ביולי 2006 שם התקבלו 14 תגובות

אנוכי בתאריך 7/29/2006 10:44:09 PM

תיקון קטן

אם:
(n+1)/2=57
אז
n=113
ולא 115. לא שזה קריטי במיוחד, ועדיין…

עידן דורפמן [אתר] בתאריך 7/30/2006 12:00:07 AM

שיעור ראשון בסטטיסטיקה

זה מה שלמדנו…
נחמד היה להיזכר בזה שוב.

מכבס ותולה [אתר] בתאריך 7/30/2006 7:26:28 AM

מעולה, תודה!

אני חושב שהשם הנכון הוא פנזר. כך, לפחות לפי ויקיפדיה.

עופר בתאריך 7/30/2006 9:34:12 AM

ללא נושא

מבטאים זאת "פאנצר".
האות "Z" בגרמנית היא "צ" בעברית.

אורן [אתר] בתאריך 7/30/2006 10:08:14 AM

מדגם מייצג?

זה כמובן מעניין ותודה.
אבל איך/על סמך מה ידעו שזה מדגם מייצג?
אני הייתי מניח שהטנקים של גדוד מסויים הם מאותה סדרת ייצור ולגדוד אחר בגיזרה אחרת יהיו טנקים בעלי מספרים סידוריים שונים שלא נתפסו (או שעוד לא הוטלו למערכה).
אגב, אני חושהב שבדיוק משיקולים אלו נוגים בצבאות העולם לתת מספרים סידוריים בסדרות עם קפיצות אקראיות בין סדרה לסידרה – כלומר בשביל להרוס את האומדן בסטטיסטי (ונדמה גם שעם מספיק נתונים אפשר להעריך גם את אורכי הסדרות ואת הקפיצות ביניהן)

אסף ברטוב בתאריך 7/30/2006 2:36:27 PM

פאנצר

כפי שהעיר עופר, הגיית השם היא פאנצר, בצד"י, ולא פאנצ'ר.
החישובים שאתה מראה שימושיים בהחלט, אך, כפי שציינת, רק בתנאי שמתקיימת ההנחה שהטנקים שנתפסו מהווים מדגם מייצג. נדמה לי שזו הנחה אופטימית למדי, לא כן? אמנם נראה שבמקרה ההוא היא היתה נכונה, אך מי תוקע לידנו במקרה הכללי שפיזור הטנקים אקראי? קל לדמיין סדרות ייצור שמיוצרות לאו דווקא בקצב הפיזור לחזיתות השונות, וכך בחזית נתונה יכולים להיות טנקים בעלי מספרים בתחום מאה עד מאתיים, בעוד שבחזית אחרת לגמרי ישנם הטנקים שמספרם בין שלוש-מאות לארבע-מאות. אם הטנקים שלקחת שלל באים מהגזרה הראשונה, תקבל אומדן רחוק מהמספר האמיתי, כי הפיזור אינו מייצג.

טנק יו בתאריך 8/19/2006 6:17:33 PM

עבור מדגם בגודל 1

תמיד לימדו אותי שאם רואים טנק אחד שמספרו 109, האמדן הטוב ביותר למספר הטנקים הוא 109 ולא 216. מדוע? נניח שמספר הטנקים הוא N, הסיכוי שנדגום מתוכו 109 הוא 1 חלקי N. הערך של N עבורו הסיכוי מקסימלי הוא 109.

עמי איילון בתאריך 8/24/2006 4:44:50 PM

אוניית חיל הים ק-16

שיעור קטן בהיסטוריה: האונייה הראשונה של חיל הים נקראה ק-16 רק מהסיבה שאויבינו יחשבו שיש לנו כבר עוד 15 ספינות שמסתובבות להן איפשהו בים
לכן, האומדן הזה לא תמיד מדויק

ירון בתאריך 1/3/2007 9:00:57 AM

ללא נושא

יש דרך להתגבר על הקפיצות במיספור?
יש דרך לדעת מה גודל הטעות האפשרית?

יוסי לוי [אתר] בתאריך 1/3/2007 9:40:14 AM

תשובה לירון

שאלות טובות.
התשובה היא בעקרון כן לשתי השאלות, אם כי הרבה יותר קשה להתגבר על קפיצות במספור.
את גודל הטעות, לעומת זאת, קל מאוד להעריך (זה חומר של שנה א בלימודי במוסמך)

ירון בתאריך 1/7/2007 11:42:38 AM

ללא נושא

אם תוכל להתוות את הדרך לתשובות, זה יהיה נהדר. (אני לא אגיד "הסברים לעמך", כי אני יודע לאן זה יכול להוביל, ואני מחפש הסבר אמיתי).

יוסי לוי [אתר] בתאריך 1/7/2007 5:26:20 PM

התוויות

לגבי הערכת הטעות – לכל אומד נראות מקסימלי – Maximum Likelihood Estimator (וזהו בעקרון האמדן שהוצג כאן) ניתן לקבל ביטוי לשונות האומד – וממנה הערכה לטעות על ידי בניית רווח סמך.
לגבי קפיצות במספרים – כאן צריך לנסות לבנות מודל כלשהו לקפיצות ולנסות לאמוד את הפרמטרים שלו.

דב [אתר] בתאריך 1/14/2007 4:11:13 PM

שלילת אומדן

בהינתן שאלו המספר שנתפסו האם הם שוללים (ברמת מובהקות של 95%) את העובדה שיש 1,000 טנקים ורק נתפסו כאלו עם המספרים הנמוכים ?

יוסי לוי [אתר] בתאריך 1/14/2007 6:11:57 PM

תשובה לדב

אני לא יכול לענות על השאלה הזו כי היא לא ממש ברורה. בכל מקרה, רמת מובהקות של 95% היא ממש, אבל ממש גבוהה מדי.
אני ממליץ לך לקרוא את הרשימה "בין שתי טעויות" ולנסח את השאלה מחדש

נשלח: 4 בדצמבר, 2008. נושאים: היסטוריה, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

החיזבאללה והבליץ על לונדון

מנהיג החיזבאללה, חסן נאסראללה, הכריז היום כי ההתקפה על חיפה לא כוונה אל מפעלי התעשיה שבעיר, כדי שלא לגרום אסון לתושבי העיר. ממש יפה מצידו על ההתחשבות. ייתכן מאוד כי מדובר בעוד תרגיל של לוחמה פסיכולוגית, אבל האם ייתכן כי אכן יש אמת בדבריו? אני לא איש מודיעין, לא מקורב למודיעין, ובכלל לא שותף לשום סוד צבאי, אבל אני מקווה שהמודיעין שלנו יודע יותר ממני. אם נאסראללה אכן דיבר אמת, אנחנו עלולים להיות במצב ביש.

טיל V2 גרמני מוכן לשיגור – מכוון או לא מכוון?

איך בכלל יודעים האם יש לאויב המשגר לעברך טילים יכולת לכוון אותם למטרה נקודתית? עם השאלה הזו התמודדו קברניטי בריטניה בזמן הבליץ על לונדון במלחמת העולם השניה. אל לונדון נורו מאות טילים מסוג V2. האם יכלו הגרמנים לכוון את הטילים אל מטרות מוגדרות, או רק שיגרו אותם בכיוון הכללי של לונדון, בתקווה שיגרמו נזק גדול ככל האפשר? מיותר לציין את החשיבות של התשובה לשאלה זו.

התשובה לשאלה נמצאה בעזרת ניתוח סטטיסטי של הנתונים על נקודות הפגיעה של הטילים.

הבריטים לקחו ריבוע בגודל של 12×12 קמ"ר בדרום לונדון, שהכיל את האזור בו פגעו 535 טילים. הם חילקו את הריבוע הזה ל-576 ריבועים שגודל כל אחד מהם 0.25 קמ"ר. אם הטילים אינם מכוונים, ופוגעים במטרות אקראיות בתוך הריבוע, הרי שהסיכוי כי טיל יפגע בריבוע קטן מסויים הוא 535/576 כלומר, 0.929. במלים אחרות – בכל ריבוע קטן פגעו 0.929 טילים, בממוצע.

אבל נתוני הפגיעה אינם ממוצעים, כמובן. מספר הטילים שפגעו בפועל בריבוע מסויים חייב להיות מספר שלם לא שלילי: 0, 1, 2, וכן הלאה. הבריטים פשוט ספרו כמה טילים פגעו בכל אחד מהריבועים. הרעיון הוא שאם הטילים מכוונים, יהיו הרבה ריבועים עם מספר גדול של פגיעות, וגם הרבה ריבועים ללא פגיעות בכלל. לעומת זאת, אם הטילים אינם מכוונים ופוגעים במטרות מקריות, נצפה למצוא מספר גדול יחסית של ריבועים ללא פגיעה כלל, מספר דומה (אך קטן במעט) של ריבועים שבהם פגע טיל אחד בלבד, מספר הרבה יותר קטן של ריבועים עם שתי פגיעות, ומספרים קטנים והולכים של ריבועים עם 3 פגיעות 4 פגיעות, ויותר מכך.

ניתן להוכיח מתמטית, כי אם פיזור פגיעות הטילים על פני השטח הוא אקראי, הרי שהתפלגות מספר הטילים בריבוע מסויים היא התפלגות פואסונית, ובעזרת הנוסחה של התפלגות זו ניתן לחשב את המספר הצפוי של ריבועים ללא פגיעה, ריבועים עם פגיעה אחת, וכולי.

נתוני הפגיעה הראו כי ב-229 ריבועים לא פגע אף לא טיל אחד, וב-211 ריבועים נרשמה פגיעה יחידה. ב-93 ריבועים פגעו שני טילים, ב-35 ריבועים פגעו שלושה טילים, 7 ריבועים נפגעו על ידי ארבעה טילים, ובריבוע אחד בלבד פגעו 5 טילים.

מספרים אלה דומים מאוד למספרים הצפויים שחושבו מנוסחת ההתפלגות הפואסונית: 227.3 ריבועים ללא פגיעה, 211.4 ריבועים עם פגיעה אחת, 98.3 ריבועים עם 2 פגיעות, 30.5 ריבועים עם 3 פגיעות, 7.1 ריבועים עם 4 פגיעות, ו-1.3 ריבועים עם 5 פגיעות (אלה חישובים תיאורטיים – ולכן המספרים לא שלמים).

הנתונים הראו עדות מובהקת לכך שלטילי ה-V2 לא היה מנגנון הכוונה. בסוף המלחמה, כשתפסו בעלות הברית את הטילים שהיו במחסני הגרמנים – אכן הובהר כי הסטטיסטיקה צדקה גם הפעם.

על שימוש אחר של התפלגות פואסון – קראו ברשימתי "אז כמה יזכו בפרס הראשון בהגרלת 50 המליון?"

פורסם לראשונה באתר "רשימות" בתאריך 16 ביולי 2006 שם התקבלו 13 תגובות

עריכה: 2/6/2022:
לפניי מספר ימים קיבלתי מייל מעניין מאחד הקוראים שהתייחס לרשימה זו. אני מצטט אותו כאן:

אפשר להוסיף זווית היסטורית סטטיסטית מעניינת מאוד לנושא .הסיפור מסופר במלואו בספר של ר. ו. ג’ונס "מלחמה סודית ביותר". מסתבר שגם ל v 1 וגם ל v2 הייתה מערכת כיוון פרימיטיבית אבל עובדת והבריטים ידעו זאת. ג’ונס שהיה אחראי על מודיעין מדעי בשירות הביון הבריטי ביצע ניתוח סטטיסטי של נקודת הפגיעות הממוצעת של הרקטות ( המטרה היחידה הייתה לונדון) ודאג להעביר בתקשורת הבריטית ובשיטות חשאיות דיווח מוטעה לגרמנים על פגיעות בפועל כארוכות מידי ואכן תוך ימים הגרמנים קיצרו הטווח כך שבסופו של יום ,הרוב המכריע של הרקטות לא פגעו כלל בשטח העיר. הוא הניח בצדק שהגרמנים מבצעים אותו ניתוח סטטיסטי של נקודת הפגיעה הממוצעת ורק סיפק להם נתונים מטעים.

אני כמובן מודה לקורא שהאיר את עיניי וגם מודה שהאמירה כי לאחר המלחמה התברר שלטילים לא הייתה מערכת כיוון, אותה ציינתי בפוסט, לא הסתמכה על מקור היסטורי, אלא סוג של "תורה שבעל פה" שעוברת מכל דור של סטטיסטיקאים אל הדור שבא אחריו… מה גם שהנתונים תומכים בהשערה כי לא הייתה יכולת כיוון. ואני כמובן גם מודה לקורא שהעיר את עיניי. הוא גם ציין כי בספר יש עוד כמה דוגמאות לניתוחים סטטיסטיים. הספר נמצא על שולחני, ואני מניח שאלמד עוד דברים חדשים מהקריאה שלו 🙂

ליה ברגר [אתר] בתאריך 7/17/2006 12:27:37 AM

כך או אחרת, צריך להשמיד את חיזבאללה

זה בכלל לא משנה לאיזו מטרה נסראללה מכוון. זה בכלל לא אמור לעניין מדינה שמאיימים על ריבונותה בטילים אינספור שהורגים ופוצעים את תושבי הערים שלה.
את נסראללה צריך להשמיד, ובסוף יעשו זאת. צריך פשוט סבלנות.
אזרחי ישראל צריכים לגלות אורך רוח והפעם – פעם אחת באמת! – לתת לצה"ל לנצח.
לאפשר לחיל האוויר לכתוש עד דק את חיזבאללה. רוצים לפתור את הבעיה?
צריך לשלם מחיר.
אז יהיו עוד כמה מאות קטיושות וקסאמים, אבל בסופו של דבר חיל האוויר חזק יותר, והוא ינצח.

עומרון [אתר] בתאריך 7/17/2006 8:49:24 AM

אז אולי תיקח על עצמך

את האתגר של לחשב האם החיזבאללה יודע לאן הוא מכוון או לא.
אולי תתרום למודיעין (אני בטוח שהם לא מעסיקים סטטיסטיקאים שבודקים את הדברים הללו).

מצפה הילה בתאריך 7/17/2006 8:55:55 AM

על הסיכויים של נסראללה, ושלנו

http://israblog.nana.co.il/blogread.asp?blog=271331

ברל בתאריך 7/17/2006 9:14:46 AM

ללא נושא

יש לי צורך עז לתרום תגובה ענינית: אחלה פוסט!

מרק ק. [אתר] בתאריך 7/17/2006 9:19:03 AM

עומרון

החיזבאללה יודע אולי לאן הוא מכוון, אבל אין לא שום דרך לנבא היכן הוא יפגע, יותר מדי משתנים אטמוספריים שמשפיעים יותר ויותר ככל שהטווח גדל.

עמי [אתר] בתאריך 7/17/2006 10:57:56 AM

ללא נושא

סיפור מצוין! נורא מזמין יישום במרומותינו.
הלו מודיעין! מישהו בסביבה?

אביב בתאריך 7/17/2006 12:19:57 PM

ללא נושא

שאלה הרבה יותר מעניינת היא האם הקברניטים שלנו יודעים לאן הם מכוונים או אולי יורים באקראי בלי לדעת מה יקרה. אם להסתכל בזיגזוגים של 13 השנים האחרונות ההתנהלות שלנו דומה הרבה יותר להליכת שיכור מאשר להתקדמות עם מנגנון הכוונה

שושן בתאריך 7/17/2006 3:49:41 PM

ללא נושא

פוסט מעניין!
מהיכן המקורות?

פישנזון [אתר] בתאריך 7/17/2006 4:21:52 PM

ללא נושא

אה… :-/

dani בתאריך 7/17/2006 7:45:49 PM

accuracy

free flight rockets to this range have an accuracy of about 2% (cep). this means a radius of appr. 1km for 50% of the hits. hence it is practically impossible to at targets like the refinaries. it`s more probable that they tried to hit them, and when missed, claimed that they didn`t really try to…

סתם אחד בתאריך 7/18/2006 12:14:24 AM

פוסט חביב, אבל

הרעיון הסטטיסטי לא רע, אלא שלהבדיל ממצב המודיעין הבריטי לגבי טילי ה-V2 (הם, ככתוב בפוסט *לא ידעו* האם ניתן לכוון אותם או לא) אנחנו מכירים את התחמושת המשוגרת כעת לעבר חיפה (ספציפית, טילי פג'ר).
טילים אלו, כמו שארית סוגי הקטיושות והרקטות שנפלו כאן עד כה (אינני יודע אם יש בידי החיזבאללה גם טילים משוכללים יותר, כמו אלו שנורו על הסטי"ל למשל, רק קרקע-קרקע) אינם ניתנים לכיוון, אלא מושלכים בכיוון ידני של המשגר.
ניתן לעשות איכונים ולתקן בשיגור הבא לפי התוצאות הקודמות וכך לשפר פגיעות (במצב הנוכחי לחיזבאללה זה די קשה, כי הם משגרים ובורחים – אחרת מסוקינו ישגרו את המשגר יחד עם צוות השיגור לפגישה מוקדמת עם הנביא מוחמד) אבל כמו שכתב כאן מישהו קודם, זה מושפע גם מרוחות, מתקינות הפגז והמשגר (שאיכות האיחסון שלהם במרתפי החיזבאללה לא הכי טובים שיש) ועוד כמה וכמה משתנים.
בכל אופן, החכמנו מהניתוח הסטטיסטי.

ירון בתאריך 1/3/2007 9:11:14 AM

שאלה עקרונית

יש כאן עניין של ביצה ותרנגולת: אם אנו מניחיחם שהטילים לא מכוונים אז אפשר להוכיח מתמטית שההתפלגות תהיה פואסונית.
אבל אם ההתפלגות פואסונים זה לא אומר שהטילים לא מכוונים. אולי גם בטילים מכוונים יש התפלגות דמויית פואסונית.
עכשין, כתבת שאם הטילים מכוונים ההנחה של הסטטיסטיקאים היתה שיהיו הרבה ריבועים אם הרבה פגיעות והרבה ריבועים עם 0 פגיעות. זוהי הנחה שעומדת מאחוריה הנחה מקדימה לגבי מידת הפיזור של המקומות האסטרטגיים של לונדון, ומידת הידיעה של האוייב על מידת הפיזור הזאת. תאר לך שהמקומות האסטרטגיים של לונדון מפוזרים בריבועים שמייצגים התפלגות פואסונית: קרי יש מעט ריבועים המכילים מקומות אסטרטגיים ממעלה ראשונה, קצת יותר ריבועים המכילים מקומות אסטרטגיים ממעלה שנייה וכו'. במקרה כזה, אם הטילים יכוונו למקומות האסטרטגיים לפי סדר החשיבות שלהם, אזי ההתפלגות תהיה פואסונית בדיוק כמו בטילים לא מכוונים – לא?
בנוסף – אולי יש כאן מסקנות לגבי הדרך העדיפה למקם את המתקנים האסטרטגיים של עיר מסויימת?…

יוסי לוי [אתר] בתאריך 1/3/2007 9:47:44 AM

תשובה לירון

בשאלה העקרונית (עניין הביצה והתרנגולת) – נגעת כאן בבעיה עקרונית חשובה העומדת בבסיסה של כל בעיית הכרעה, לאו דווקא סטטיסטית.
בתור התחלה אני ממליץ לך לקרוא את הרשימה "בין שתי טעויות"
ניימן ופירסון הבהירו כי לבעיית הכרעה יש משמעות רק כאשר מול ההשערה היסודית ניצבת אלטרנטיבה מוגדרת היטב.
אני מסכים איתך שאם האלטרנטיבה שונה (למשל, שני ההסברים שהצעת), אז הפתרון שהוצע אינו מתאים.

נשלח: 4 בדצמבר, 2008. נושאים: היסטוריה, מה אומרת הסטטיסטיקה.
תגובות: 1 | טראקבק

איך אומרים סודוקו בלטינית?

לטקס במטה הכללי הגיעו 36 קצינים משש אוגדות – שישה קצינים מכל אוגדה.יתר על כן, כל אוגדה שלחה לטקס סגן משנה אחד, סגן אחד, וכן סרן, רב-סרן, סגן-אלוף ואלוף-משנה. מנהל הטקס ביקש לסדר את הקצינים ב-6 שורות של ששה קצינים – כך שבכל שורה ובכל עמודה יעמוד קצין אחד מכל אוגדה וקצין אחד מכל דרגה. איך יסדר את הקצינים?

השעשוע של אוילר הפך לכלי שימושי בסטטיסטיקה המודרנית

בבעיה הזאת התחבט ליאונרד אוילר, מתמטיקאי שוויצרי, בשנת 1779. אוילר אמנם התעניין בבעיה כדי לשעשע את עצמו, אך משלא הצליח לפתור אותה החליט לתקוף אותה ביתר רצינות. ארבע שנים לפני מותו הובילה אותו בעיית הקצינים למחקר של יצור מתמטי חדש – הריבוע הלטיני.

מהו ריבוע לטיני? כל מי שיודע מהו סודוקו יודע גם מהו ריבוע לטיני: זהו ריבוע המחולק למשבצות: n שורות ו-n עמודות, כאשר בכל משבצת מופיע אחד המספרים בין 1 ל-n (או אחת מ-n האותיות הראשונות באלפבית הלטיני – ומכאן השם "ריבוע לטיני"). על האותיות להיות מסודרות כך שבכל שורה ובכל עמודה תופיע כל אות בדיוק פעם אחת. כדרכם של מתמטיקאים נבר אוילר בריבועים הלטיניים שהמציא, שיער השערות, גילה תכונות מעניינות, מיין את הריבועים הלטיניים למשפחות שונות, כיד הדמיון הטובה עליו. הוא חש כי בעיית הקצינים אינה ניתנת לפתרון, ואף ניסח השערה כללית לגבי התנאים בהם הבעיה פתירה. הבעיה הכללית נפתרה רק ב-1960, כאשר הוכח כי השערתו של אוילר הייתה מוטעית. הבעיה המקורית אמנם אינה פתירה, אך עבור מספרים אחרים של אוגדות ודרגות, קיימים פתרונות.

השאלה היחידה שבאמת לא עניינה את אוילר היא השאלה היישומית. איזה תועלת עשויה לצמוח מחקר הריבועים הלטיניים? עבור אוילר הדבר לא העלה ולא הוריד. אולם, כפי שקרה לא פעם, יתברר כי לריבועים הלטיניים יש יישומים מעשיים רבים, ושעשועון הסודוקו הוא רק אחד מהם. ריבועים לטיניים שימשו לפיתוח אלגוריתמים לפתרון בעיות של חלוקת משאבים והקצאתם, שצצות כמעט בכל תחום של ייצור, מחשוב, ואפילו בחלוקת עוגה בין ילדים. שימוש נוסף לריבועים לטיניים הוא בתחום ההצפנה. אולם השימוש העיקרי לריבועים לטיניים הוא בסטטיסטיקה.

הכימאי ממבשלת הבירה הניח את היסודות לענף מרכזי בסטטיסטיקה

ויליאם גוסט (Gosset), מחלוצי הסטטיסטיקה, היה כימאי שעבר לפרנסתו במבשלות הבירה של גינס. אחד מתפקידיו היה למצוא דרכים לשיפור כמות ואיכות השעורה שגודלה עבור מפעלי הבירה. גוסט התבקש לבחון חמישה סוגי דשן שהוצעו לשימוש בגידול השעורה. פתרון פשטני לבעיה הוא לבחור חמישה שדות, ובכל שדה לנסות סוג אחר של דשן. ניסוי כזה הוא בעייתי. אם יהיו הבדלים ביבולים השונים, לא יהיה אפשר להסיק בודאות כי ההבדלים נגרמו על ידי הדשנים. בשדות שונים יש תנאי גידול שונים: אדמה, אקלים מזיקים, כל אלה יכולים להשפיע על גידול השעורה. הניסוי חייב להיות מבוקר: כל תנאי הגידול, פרט לסוג הדשן, חייבים להיות זהים במידת האפשר. הפתרון של גוסט היה לבחור שדה ריבועי, ולחלק אותו ל-25 ריבועים קטנים. בכל אחד מחלקי הריבוע נעשה שימוש בדשן אחר, כך שבכל שורה ובכל עמודה נעשה שימוש בכל סוגי הדשן. אם נסמן את סוגי הדשן ב-A, B, C, D, ו-E, השדה של גוסט נראה בערך כך:

כלומר, התכנון של גוסט התבסס על הריבוע הלטיני של אוילר. הפיזור של הדשנים על כל השדה מנעו גם את האפקט האפשרי של המיקום בשדה (במרכז או סמוך לקצה) על גידול השעורה. כל שנותר לעשות הוא להמתין לקציר ולהשוות את היבול שהתקבל מכל אחד מהדשנים. הניסוי של גוסט הוביל מאוחר יותר לפיתוח ענף שלם בסטטיסטיקה – תכנון ניסויים.

פורסם לראשונה באתר "רשימות" בתאריך 17 ביוני 2005 שם התקבלה שם התקבלה שם התקבלו9 תגובות

סודוקון בתאריך 6/18/2005 12:00:01 AM

שאלה ליוסי

האם יש אלגוריתם כללי לפתרון בעיות סודוקו (כלומר, האם הבעיה כריעה)?
אם כן, האם ידוע אלגוריתם יעיל? (פולינומיאלי בזמן ריצה)

אבנר בתאריך 6/18/2005 8:36:20 AM

התנאי היותר מורכב של ריבוע לטיני

פרט לכך שכל עמודה וכל שורה תכלול כל אחד מהפריטים, ישנם מצבים שבהם נדרש שגם סדר הפריטים ישתנה, כך שאם א הופיע בשורה אחת לפני ובצמוד ל-ב באף אחת מהשורות הבאות לא נחזור על כך (אותו תנאי תקף גם לטורים). בסודוקו של תשע נדמה לי שזה בלתי אפשרי, זה בודאות אפרשרי בריבוע לטיני של שלושה טורים על שלוש שורות. איפשהו בדרך בין 3X3 ל-9X9 הבעייה הופכת לבלתי פתירה.

יוסי [אתר] בתאריך 6/18/2005 1:22:21 PM

תשובה לסודוקון

קיים אלגוריתם כללי כמובן.
כיוון שמספר הסידורים של 81 סימנים ב-81 משבצות הוא סופי, הרי שניתן "פשוט" לעבור על כולם, עד שיימצא הפתרון הנכון.
לעומת זאת, מי שניסה לפתור סודוקו "קשה" נוכח בודאי כי לפעמים יש צורך בבדיקת מספר אפשרויות עבור משבצת מסויימת, ולכן המסקנה היא כי בעיית פתרון הסודוקו נמצאת ב-NP, ומכאן שלא ידוע אם קיים אלגוריתם יעיל (פולינומיאלי( לפתרון הבעיה.

יוסי [אתר] בתאריך 6/18/2005 1:25:03 PM

תשובה לאבנר

התנאי שציינת יכול להתקיים בכל ריבוע לטיני מסדר זוגי, ואינו יכול להתקיים בריבוע לטיני מסדר אי זוגי.

בתאריך 6/19/2005 12:00:23 AM

ישנה הוכחה מסודרת יותר

ישנה הוכחה מסודרת יותר להיות הבעיה של הסודוקו NP-שלמה (כל הבעיות בP הן בNP זה לא עוזר לי כלום לדעת שהיא בNP השאלה היא אם היא NP שלמה או בP)
אפשר למצוא במאמר מסויים של סינים.

יוסי לוי [אתר] בתאריך 6/19/2005 7:40:44 AM

תשובה למגיב הקודם

תודה על ההערה הנכונה

הראל בתאריך 7/5/2005 12:14:56 PM

לאונדר פולר, ידיהוט אחרונוט

בספרון שהוצאת ידיעות אחרונות הוציאה ונקרא משהו כמו "נפלאות הסודוקו", כתוב בהקדמה שהסודוקו הומצא תחת השם "משבצות לטיניות" על ידי מתמטיקאי שוויצרי משועמם בשם לאונרד פולר.
ידיעות אחרונות כבר קראתם??

הראל בתאריך 7/5/2005 12:16:11 PM

NP-C

בערך האנגלי על סודוקו בויקיפדיה תמצאו קישור למאמר שמוכיח כי הבעייה היא NP שלמה.

ג. יפית בתאריך 8/31/2005 11:47:37 AM

גם חבר שלך כותב פה על סודוקו

http://www.notes.co.il/ben-hateva/12445.asp
אבל עם כל הצרה נשגבה ממני הדרך שהוא הרכיב שם את המשחק. די מבולבל מה שהוא עשה שמה.

נשלח: 4 בדצמבר, 2008. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, הממ... מעניין....
תגובות: אין | טראקבק