ארכיב עבור תגית תחזיות
הכוכב הנעלם והאמד הכחול: משפט גאוס מרקוב ושיטת הריבועים הפחותים
שמחה גדולה אחזה בעולם האסטרונומיה בשנת 1781, עם גילויו של כוכב הלכת אוראנוס. לאחר שכוכב לכת זה נצפה, מסלולו חושב ומרחקו מהשמש הוערך, התברר כי מרחקו מהשמש מתאים לתחזית של "חוק טיטיוס-בודה", מעין להטוט חשבוני (שגוי, כך התברר בדיעבד) המתאר את מרחקו של כוכב לכת מהשמש כפונקציה של מספרו הסידורי. החוק תיאר בצורה טובה את מרחקיהם של כל כוכבי הלכת שהיו חדועים עד אז, אך השאיר "חור" בין מאדים לצדק. לפי החוק, "צריך" היה להיות שם עוד כוכב לכת, שלא נתגלה עדיין.
האסטרונומים הפנו את מאמציהם לגילוי כוכב הלכת האבוד. המאמץ נשא פרי כעבור 20 שנה. באחד בינואר 1801 גילה האסטרונום האיטלקי ג'וזפה פיאצי גוף שמימי שנע במסלול המיועד לכוכב הלכת האבוד. הוא כינה כוכב לכת חדש זה בשם צרס, לכבוד אלת החקלאות הרומית.
שמחתם של פיאצי ועמיתיו הייתה קצרה. לאחר שצפו בצרס במשך 41 לילות, "התקרב" מסלולו אל השמש, ובשל אורה החזק לא יכלו המשיך ולצפות בו. כמובן, כאשר יסיים צרס את הקפתו ויופיע מצידה השני של השמש יוכלו לצפות בו שוב, אבל, היכן בדיוק יופיע בשמי הלילה? הנתונים המועטים שנצברו (רק 22 תצפיות בפועל נאספו במשך 41 הלילות) לא אפשרו חישוב מדוייק של מסלולו.
מספר מלומדים ניסו לחזות את מסלולו של הכוכב הסורר. אחד מהם היה קרל פרידריך גאוס, מתמטיקאי ואסטרונום מהאוניברסיטה של גטינגן (אני מניח שכבר שמעתם עליו אי אלו פעמים). גאוס פרסם את תחזיתו למסלול של צרס בספטמבר 1801. צרס ציית לתחזיותיו של גאוס, והופיע בשמים בהתאם. עם גילוים של אסטרואידים נוספים שנעו במסלול בין מאדים לצדק, חזר גאוס על התרגיל וחישב את מסלולם של רבים מהם.

שרטוט המסלולים של האסטרואידים צרס ופאלאס על ידי גאוס (מקור: http://www.math.rutgers.edu/~cherlin/History/Papers1999/weiss.html)
מה היה הסוד של גאוס? רק ב-1809 פרסם גאוס ברבים את שיטתו, הידועה כיום כשיטת הריבועים הפחותים. ככל הנראה, גאוס נכנע ופרסם את השיטה רק לאחר שהמתמטיקאי הצרפתי לז'נדר פרסם בשנת 1806 את שיטתו לחישוב מסלולי שביטים, ולמעשה הוא שטבע את שם השיטה :"Méthode des Moindres Quarrés ". עם זאת, ידוע כי גאוס הכיר את השיטה כבר ב-1795, והוכיח ב-1798 כי אמד הריבועים הפחותים הוא אמד נראות מירבית – Maximum Likelihood Estimator (כמובן, המושגים האלה, שלקוחים מתחום התיאוריה הסטטיסטית, עדיין לא היו ידועים בימיו). ב-1823 הוכיח גאוס כי השיטה אכן מספקת את האמד הלינארי הטוב ביותר במובן שזהו האמד הלינארי חסר ההטיה ששונותו מינימלית. מכאן הופיע הביטוי "אמד כחול" בכותרת הרשימה. כחול – BLUE- הם ראשי התיבות של Best Linear Unbiased Estimator. אין צורך להבהל מהמונחים הטכניים האלה, שלא אסביר בפירוט. אומר רק כי במלים פשוטות, גאוס הוכיח כי השיטה אופטימלית בשלושה מובנים שונים – גם נראות מירבית, גם שונות מינימלית וגם חסר הטיה.

גאוס (משמאל) ומרקוב חולקים בתהילה של שיטת הריבועים הפחותים
המתמטיקאי הרוסי אנדריי אנדרייביץ מרקוב, שידוע בעיקר בזכות תרומתו לחקר התהליכים המקריים, תיאר בפירוט את שיטת הריבועים הפחותים בספר שפרסם ב-1912, וניסח אותה מחדש באופן ברור יותר, ובכך תרם את תרומתו להפצתה של השיטה ולפיתוחה. בזכות תרומתו זו זכה לחלוק בתהילה עם גאוס, והמשפט המוכיח את האופטימליות של שיטת הריבועים הפחותים נקרא משפש גאוס-מרקוב.
השיטה והכללותיה משמשות עד היום ככלי מרכזי לניתוח סטטיסטי של נתונים, ונמצאת בשימוש גם במדעים המדוייקים וגם במדעי החברה, בעיקר בתחום הכלכלה. סטיבן לויט, מחבר הספר רב המכר "פריקונומיקס", כתב בספרו כי השימוש בשיטה הוא "יותר אמנות מאשר מדע". אני חולק על דבריו. זוהי שיטה מדעית, המבוססת על תיאוריה מתמטית. יש לה יתרונות עצומים, כמובן, אך גם מגבלות. המשתמש בה חייב תמיד להיות מודע למגבלות האלה, ולא, מסקנותיו יהיו שגויות.
עד כאן ה"ציונות". אבל מהי בעצם שיטת הריבועים הפחותים? אנסה כעת לתת הסבר שווה לכל נפש.
נניח כי יש בידינו קבוצת נתונים, שנאספה ממדגם כלשהו. לכל פרט במדגם יש שני נתונים כמותיים. לדוגמא, אם אנו מסתכלים על מדגם של כפרים, נתון אחד יכול להיות מספר החסידות שקיננו בכפר באביב, והנתון השני יכול להיות מספר הלידות שהיו בכפר בקיץ שלאחר מכן. כלכלנים יעדיפו אולי להסתכל על מדגם של מדינות, כאשר נתון אחד הוא גובה המס שמטילה ממשלת המדינה על העסקים בתחומה, והנתון השני הוא הכנסות הממשלה ממסים באחוזים מהתמ"ג. חוקרים בחברת תרופות יסתכלו על מדגם של חולים, ויאספו נתונים על מינון התרופה הנסיונית שניתן לכל חולה ועל השינוי במצבו. בכל מקרה, אפשר לשרטט את הנתונים שהתקבלו על מערכת צירים, ומתקבלת דיאגרמת פיזור (scatterplot). בשרטוט אנו רואים מדגם בגודל עשרה כפרים. הנקודה המסומנת בחץ, לדוגמא, מייצגת כפר במדגם בו קיננו עשר חסידות ונולדו שני תינוקות (הנתונים לא אמיתיים, כמובן, אלא נדגמו ממוחי הקודח):
|
|
נניח שאנו רוצים לגלות האם קיים קשר קווי בין שני המשתנים. במלים אחרות, אנו שואלים את עצמנו האם ניתן לשרטט על מערכת הצירים קו שיתאר את הקשר בין המשתנים? כמובן שאי אפשר לשרטט קו ישר שיעבור דרך כל 10 הנקודות, אבל ישנם הרבה (אינסוף) קוים שעוברים דרך "ענן" הנקודות שלנו. שרטטתי כמה מהם על פני מערכת הצירים. איזה מהם מתאר את הקשר בין שני המשתנים בצורה הטובה ביותר?
![]() |
הנה הרעיון של גאוס. הוא בחר קו ישר אחד, ומדד את המרחק האנכי מכל נקודה אל הקו. סימנתי את המרחק האנכי מכל נקודה אל הקו על השרטוט שלנו. בכפר הראשון, בו קיננו 2 חסידות והיו 10 לידות, המרחק האנכי (כלומר אורך הקו האדום) הוא בערך 5. בכפר השני, בו קיננו 3 חסידות והיו 5 לידות, אורך הקו האדום הוא בערך 0.5, אבל כיוון שהנקודה נמצאת מתחת לקו, המרחק האנכי הוא 0.5-.
|
|
הקו האידיאלי הוא זה שעבורו כל המרחקים האנכיים שוים לאפס, אבל קו כזה לא קיים בדרך כלל. לכן אין ברירה אלא לחשב את הקו האופטימלי. אפשר, למשל, לחפש את הקו שעבורו סכום המרחקים בערכיהם המוחלטים הוא מינימלי. גאוס הבין כי עדיף לחפש את הקו שעבורו סכום ריבועי המרחקים הוא מינימלי (מכאן השם "ריבועים פחותים" – "Least Squares"). גאוס גם הראה כיצד ניתן למצוא את הקו האופטימלי. כל קו ישר ניתן לאפיון מלא על ידי שני פרמטרים – שיפועו ונקודת החיתוך שלו עם הציר האנכי. לכן ניתן לרשום את סכום ריבועי המרחקים האנכיים כפונקציה של שני הפרמטרים האלה, ולמצוא את נקודת המינימום של הפונקציה. ניתן לעשות זאת על ידי שימוש בחשבון דיפרנציאלי או תוך כדי שימוש בשיקולים גיאומטריים/אלגבריים. אפשר לחשב ולמצוא כי הקו האופטימלי לנתונים שבדוגמא הוא:
|
|
ניתן לפרש זאת בערך כך: גם ללא חסידות יהיו בממוצע 6.8 לידות, וכל חמש (בערך) חסידות נוספות יביאו ללידת תינוק נוסף. אינטרפרטציה מפתה נוספת היא אינטרפרטצית הניבוי: מה יקרה בכפר בו יקננו 20 חסידות? אם נציב 20 בנוסחא, קו הריבועים הפחותים ינבא כי יהיו בכפר זה 10.6 לידות.
אבל, אבוי, קו הריבועים הפחותים אינו מאפשר ניבוי אמיתי. הפרמטרים הנאמדים (שהם כזכור שיפוע הקו ונקודת החיתוך שלו עם הציר האנכי) תלויים ישירות במקדם המתאם בין שני המשתנים. קו הריבועים הפחותים מתאר קשר אפשרי בין המשתנים, אבל לא סיבה ותוצאה. גם אם היינו מחליפים את תפקידי המשתנים, כמספר הלידות הוא המשתנה ה"מסביר" את מספר החסידות (כמשתנה ה"מוסבר"), מקדם המתאם בין שני המשתנים לא היה משתנה, וההסבר לפיו מספר החסידות מנבא את מספר הלידות הגיוני בדיוק כמו ההסבר לפיו מספר הלידות מנבא את מספר החסידות.
זאת ועוד: קו הריבועים הפחותים מתאר רק את מה שקורה בתחום הערכים בו צפינו. הוא לא יכול לומר לנו שום דבר על מהות הקשר בין המשתנים מחוץ לטווח הזה. במלים אחרות: קו הריבועים הפחותים הוא מודל תיאורי של הנתונים, וככזה הוא מוגבל להסברה של הנתונים המתוארים ותו לא. המציאות עשויה להיות שונה. באיור הבא מובאות ארבע דיאגרמות פיזור שמצאתי באינטרנט, עם קוי הריבועים הפחותים שהיו עשויים להתקבל לו הייינו מסתכלים רק על טווח חלקי של הנתונים:

קו הריבועים הפחותים מול המציאות - ארבע דוגמאות
גאוס הצליח בניבוי המסלול של צרס בעזרת קו הריבועים הפחותים כיוון שהסתבך על מודל מוצק, לפיו צרס (כמו שאר כוכבי הלכת) מקיף את השמש במסלול אליפטי. לאחר שיש מודל, הכלים הסטטיסטיים יכולים לאפשר את אמידת הפרמטרים שלו. ההיפך לא בהכרח נכון. ניתן להשתמש בכלים הסטטיסטיים כדי לתאר את הנתונים, אך אין די בכך כדי לבנות ולאשר מודל. לצערנו, ישנם אנשים שבכל זאת בונים מודל סביב הנתונים הסטטיסטיים שלהם, מבלי להתחשב במגבלות של כלי הרגרסיה.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 1 בינואר, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, המשפטים הגדולים של הסטטיסטיקה, מה אומרת הסטטיסטיקה.
תגובות: 6
| טראקבק
הנבואה שניתנה לכלכלנים
סקרי דעת קהל הם כלי נפוץ להשבעת הרצון לחזות את העתיד. כך גם במערכת הבחירות לנשיאות בארה"ב. יואב קרני מנהל באתרו האישי ב"רשימות" רשימת קישורים העוקבת אחרי סקרי דעת הקהל במערכת בחירות זו, עבור כל אלה שלא מוכנים להמתין בסבלנות עוד חודשיים.
אולם יש עוד דרכים לנסות לחזות את העתיד. לפרופ' ריי ס. פייר, כלכלן מאוניברסיטת ייל, אין כדור בדולח, אולם הוא מפצה על כך בידע. פייר חיבר ספר בשם "Predicting Presidential Elections and Other Things", ובתרגום חופשי "כיצד לחזות את התוצאות בבחירות לנשיאות ודברים נוספים". למעשה, ספר זה הוא טקסט ללימוד הטכניקה הסטטיסטית הידועה בשם "רגרסיה לינארית", ומודלים סטטיסטיים נוספים המהווים הכללות של הטכניקה הבסיסית. הכלכלנים, מסתבר, כל כך מאוהבים במשפחת המודלים הזו, עד שהעניקו לה שם חיבה: "אקונומטריקה" – או "מדידה כלכלית".
העיקרון הוא פשוט: אתה משער שיש קשר של סיבה ותוצאה בין שני משתנים, X ו-Y. אתה אוסף כמות מספיקה של תצפיות אודות שני המשתנים האלה, ובעזרתן מנסה למצוא נוסחה Y=aX+b המתארת את הקשר בין שני המשתנים. את הערכים a ו-b אומדים מתוך הנתונים, בעזרת שיטה שפותחה ע"י המתמטיקאי קרל פרידריך גאוס ושוכללה ע"י דורות של סטטיסטיקאים.
ובכן, פרופ' פייר ניסה לחזות את התוצאות לבחירות לנשיאות ארה"ב באמצעות שיטה דומה. ה-Y שלו הוא אחוז הקולות שמקבל אחד המועמדים, והוא משתמש במספר X-ים, שהם מדדים כלכליים שונים. פייר חוזה כי בבחירות הקרובות לנשיאות ארה"ב יקבל ג'ורג' וו. בוש 58% מהקולות.
בראיון לניו-יורק טיימס מסביר פייר מדוע הוא צודק והסקרים המתארים מירוץ צמוד טועים (ציטוטים בתרגום חופשי): "יש גבול למידת האמינות של הסקרים… המודל שלי הוכיח עצמו היסטורית עם טעות ממוצעת של 2.5% בלבד… מלחמות לא משפיעות על תוצאות הבחירות, רק האינדיקטורים הכלכליים."
אל תעצרו את נשימתכם. ב-1991 חזה המודל של פייר כי ג'ורג' בוש יביס את המועמד האלמוני מארקנסו, ביל מה-שמו. כמו כל כלכלן, ידע פייר להסביר מדוע המודל שלו טעה במקרה זה: לדבריו, השיפור במצב הכלכלי החל בעקבות מדיניות בוש, אך הבוחרים החלו להרגיש בו רק ב-1992, אחרי שקלינטון כבר תפס את מקומו בבית הלבן.
למתמטיקאי ג'ון אלן פאולוס מאוניברסיטת טמפל שבפילדלפיה יש עוד כמה טיעונים נגד המודל של פייר: כמות הנתונים בו קטנה למדי, המודל הופעל לראשונה ב-1978 על נתונים היסטוריים ולכן רוב ההצלחה שלו נובעת מעצם תהליך הבניה של המודל, וכמו כן, יש אינדיקטורים כלכליים נוספים שלא נכללים במודל אך עשויים להשפיע על תוצאות מערכת הבחירות הנוכחית.
אני אוסיף עוד הערה אחת: המודל לא באמת מנבא. המודל הוא ניחוש אינטליגנטי לגבי מאורע שיקרה בעתיד. זה מה שהסטטיסטיקה יכולה להציע לגבי העתיד: ניחוש אינטליגנטי. זה לא מעט, אבל לא יותר מכך.
אני מציע שנחכה לנובמבר (או עד לסיום ספירת הקולות בפלורידה) ונראה.
פורסם לראשונה באתר "רשימות" בתאריך 10 בספטמבר 2004 במדור מה אומרת הסטטיסטיקה שם התקבלו 6 תגובות
עדכון מתאריך 28 בננובמבר 2008: המודל צדק הניבוי המנצח, אך לא בפער הקולות (למעשה, בוש קיבל פחות קולות מגור ונבחר בזכות עיוותי שיטת האלקטורים)
רותי בתאריך 9/10/2004 6:33:18 PM
מגדת עתידות
אולי כדאי פשוט לגשת למגידת עתידות .
נראה לי כי האינטואציה של מגדת עתידות יכולה להועיל לא פחות מהמודלים של הפרופסורים המכובדים .
רותי הרחוקה מכדור הבדולח
אורי [אתר] בתאריך 9/10/2004 10:32:04 PM
ללא נושא
בשנות הארבעים הופק בהוליווד סרט שאינני זוכר כרגע את שמו, ועסק במודל לניבוי תוצאות בחירות. הסרט הוא על עיירה שהתפלגות התוצאות בה, בכל מערכת בחירות, זהה לחלוטין להתפלגות הארצית. במלים אחרות, די לעשות סקר בחירות בעיירה זו בלבד כדי לנבא את תוצאות הבחירות בזמן נתון.
יוסי לוי [אתר] בתאריך 9/11/2004 12:08:38 PM
תשובה לרותי
בואי לא ניסחף.
למודלים יש מגבלות, אמת. חשוב להיות מודעים למגבלות, ופרופ' פייר הוא לא דוגמא טובה למודעות הזו. זה לא אומר שכל מודל ראוי להזרק לפח האשפה.
יוסי לוי [אתר] בתאריך 9/11/2004 12:11:23 PM
תשובה לאורי
העיר בת-ים הייתה מנבא טוב למדי של תוצאות הבחירות בישראל בשנות ה-80.
ואם מעלים זכרונות, זכור לי סיפור של אסימוב על עתיד בו השתכללה הסטטיסטיקה עד כדי כך שמדגם של אדם אחד החליף את הבחירות הכלליות. כמובן, הסיפור היה הרבה יותר משעשע כשקראתי אותו אי שם בהיותי תלמיד תיכון, לפני שהתחלתי לעסוק בסטטיסטיקה באופן רציני.
גיל בתאריך 9/16/2004 11:48:27 PM
כמי שלמד אקונומטריקה באוניברסיטה
אני יכול לומר שזו אכן שיטה הגיונית מאוד.
אנשים הם פחות הגיוניים – הוכיח זאת פרופסור כהנמן שזכה בנובל בכלכלה על כך.
נקודה נוספת – יש מלא בדיחות עבשות על העוסקים באקונומטריקה – הקאץ' של רובן הוא שבד"כ מוצאים את מה שמחפשים.
כאן יש כמה דוגמיות:
http://cob.tamucc.edu/jlee/4310/Jokes.htm
יוסי לוי [אתר] בתאריך 9/19/2004 4:23:41 PM
תגובה לגיל
השיטה היא הגיונית, אבל נשענת על הנחות מסויימות. אם ההנחות לא תקפות, אז גם המסקנות אינן תקפות.
בכל מקרה, תודה על הלינק המצויין.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 28 בנובמבר, 2008. נושאים: כללי.
תגובות: אין
| טראקבק


