לפני יומיים פורסמה בפורום מתמטיקה בתפוז ההודעה הבאה:
נתונים מספר נקודות (x,y) .אני צריך למצוא קו מקורב לכל הנקודות. (אין לי הגדרת מתמטית לזה). אני צריך רק את הנוסחא לזה, אין צורך בהסברים
כיוון שכך, הוא אכן קיבל את הנוסחא בלבד, ללא הסברים, ממנהל הפורום שהיה באותו בוקר במצב רוח ציני משהו:
אתה מעוניין לחשב את קו הריבועים הפחותים, שנקרא גם קו הרגרסיה.
אמנם אתה לא מעוניין בהסברים אבל אני ממליץ לך להתעניין – הנה סיפור שיבהיר מדוע זה כדאי.
הנוסחא, בכל אופן היא:
b=inv(X’X)*X’*Y
בהצלחה.
וכצפוי, כעבור שעה קלה באה הודעת תגובה משואל השאלה שכותרתה "סליחה, אבל לא הבנתי את התשובה" עם בקשות להסברים ("מה זה INV?" וכולי), בהם לא היה מעוניין בתחילה.
כל אחד מאיתנו משתמש בחיי היום יום במכשירים רבים. לרובנו אין מושג כיצד המכשירים האלה פועלים. איך פועלת הטלוויזיה? מה גורם למקרר לקרר? ומהם העקרונות הפיזיקליים והמכניים המניעים את המכונית שלנו? ובכל זאת, רובנו המכריע יודע להשתמש במכשירים האלה בצורה נכונה. אנו יודעים שצפיה מרובה בטלוויזיה מזיקה, שאין להכניס סיר חם למקרר, ושיש לבדוק בקביעות את מצב השמן והמים במנוע המכונית, למלא את מיכל הדלק ולנהוג לפי חוקי התנועה.
אבל כשהדברים מגיעים לשימוש בכלי סטטיסטי מתוחכם, הגישה משתנית פתאום.
נכון, כדי להשתמש בשיטת הריבועים הפחותים לא צריך ידע מעמיק בתיאוריה של מרחבים וקטוריים והבנה של משפט גאוס-מרקוב. אבל צריך בכל זאת לדעת איך להשתמש בכלי הזה. כי לא מספיק רק לחשב את המקדמים של קו הרגרסיה על פי הנוסחה הנ"ל. צריך לבדוק תחילה האם השימוש ברגרסיה לינארית מתאים לנתונים שבידי השואל (ובהמשך השרשור מתברר שלא), ואם מתברר שכן, צריך גם לבדוק האם התוצאה שהתקבלה מתקבלת על הדעת. ובשביל זה צריך לדעת יותר מאשר להציב מספרים בנוסחה ולחשב.
פורסם לראשונה באתר "רשימות" בתאריך 10 באוגוסט 2005