25 באוקטובר 2011

הבעייתיות של סיכום הטמפרטורות ההיסטוריות.

הנושא של סיכום הנתונים על טמפרטורות היסטוריות שנמדדו ונרשמו במשך יותר מ 200 השנים האחרונות, שהוא הנושא של מחקר BEST, הוא נושא מאד מורכב, קשה, עתיר שגיאות אפשריות ומרווחי אי דיוק גדולים.
קיימים, לפי הפרסום, 1.6 מיליארד (מיליארד!) מספרים (מדידות), מ 39 אלף תחנות מטאורולוגיות ברחבי העולם. כללית – כול תחנה רושמת לפחות שתי מדידות – מינימום ומקסימום, לכול יום. מכשירי מדידה מודרניים רושמים טמפרטורה כול שעה.
הנה כמה מהבעיות: תחנות שונות מדדו טמפ' בפרקי זמן שונים, לא תמיד ברצף, וגם בפרקי הזמן שיש נתונים יש "חורים" – ימים או חודשים ללא נתונים. הכיסוי הגיאוגרפי בעייתי – כול המדידות נעשו במקומות מיושבים; במרחבים גדולים של העולם אין מדידות כמעט בכלל – כמו מרחבי סיביר, אלסקה וצפון קנדה, אנטרקטיקה ואזורי הג'ונגלים באפריקה, דרום אמריקה ואסיה. המחקר כולו מתייחס רק לטמפרטורות של היבשה, בנושא האוקיינוסים שמהווים מעל 70% משטח כדור הארץ אין המחקר נוגע.
מכשירי המדידה: הם לא היו תמיד באיכות אחידה, מכוילים נכון, לא תמיד מדויקים. סוג המכשיר השתנה במרוצת הזמן גם בתוך אותה תחנה, ולא תמיד יש תיעוד על שינוי המכשיר.
התחנות המטאורולוגיות זזו או שינו מקום לעיתים – שינוי המקום השפיע על הקריאה, לא תמיד יש תיעוד על כך, כאשר יש תיעוד זה מחייב תיקון בקריאות – למשל – למקרה שגובה התחנה מעל פני הים השתנה.
המיקום של עד 60-80% מהתחנות הוא בעייתי – למשל מיקום על גג מבנה, או מעל מגרש חניה סלול באספלט, או בקרבת מכונות או מזגני אוויר. מיקום לא תקין של תחנה הופך את מרווח השגיאה שלה ל +- 5 מעלות, על פי תקן השרות המטאורולוגי.
יש שגיאות אנוש בקריאה, רישום, קליטה ועיבוד של כמות כזו של נתונים.
 ניתוח כמות כזו של נתונים בעייתיים ובעלי מרווח שגיאה ניכר, במטרה להגיע בסוף למסקנה פשוטה נוסח "העולם התחמם ב 0.8 מעלות" נראה לי משימה בלתי אפשרית. כלומר – ניתן להגיע לתוצאה כזו, אבל ההיגיון והנוהל המדעי מחייב להוסיף מרווחי שיגאה אפשריים. צריך לכן להגיד: העלייה הייתה 0.8 מעלות +- 5 מעלות. (לדוגמה) – וזה הופך את המסקנה לחסרת משמעות.

המשפט "הטמפרטורות עלו במאה השנים האחרונות ב 0.8 מעלה" הוא משפט קליט וברור, אבל האמת המדעית, העובדתית שמאחוריו אינה קיימת. זהו תרגיל ביחסי ציבור, זהו משפט תעמולה, מטרתו תעמולתית, לא מדעית. אנחנו איננו מסוגלים לדעת, על פי הנתונים שיש, מה בדיוק הייתה העלייה בטמפרטורות במאה השנים האחרונות. הנתונים אינם מספיק טובים. שום כמות של אקרובטיקה סטטיסטית ומתמטית לא יכולה להעלים את הבעייתיות של איכות הנתונים.
בעיני נראה חשוד שארבע קבוצות שעשו חישובים באופן עצמאי, לכאורה, והגיעו לאותה תוצאה, ברמה של עשירית מעלה. אין דרך לנתח 1,6 מיליארד נתונים ולהגיע לתוצאה אחידה.

על אספקטים נוספים של מחקר ה BEST  אכתוב בהמשך.
יעקב

2 תגובות:

NirD אמר/ה...

יעקב, אני חוזר על מה שאמרתי כבר בעבר - מרווח השגיאה של מדידה בודדת לא משקף את מרווח השגיאה של מספר גדול של מדידות. עשיתי עכשיו ניסוי שמדגים את זה:
- הכנסתי לגליון אקסל 1000 מספרים אקראיים בין 50- ל 50 (טווח של 100) כדי לדמות 1000 מדידות שאמורות לתת ערך של 0 אבל עם טווח שגיאה של 50 לכל כיוון.
- חישבתי את הממוצע של 1000 המספרים האלו שוב ושוב כשכל פעם אני משתמש בסדרת מספרים אקראיים שונה. גם אחרי נסיונות רבים הממוצע תמיד היה במרחק של פחות מ3 מ0
- חזרתי על הניסוי והפעם עם 5000 מספרים. הפעם הממוצע היה תמיד במרחק של פחות מ2 מ0
המסקנה היא שככל שעושים יותר מדידות אפשר להגיע לממוצע קרוב יותר למספר האמיתי.
זה לא אומר שבפועל התוצאות של המחקרים שמתבססים על התחנות האלו מדוייקות. אף אחד לא אומר שהשגיאות במדידות היו אקראיות לחלוטין. יכול להיות שסדרה שלמה של מכשירי מדידה הייתה פגומה באותו אופן כך שבסדרה שלמה של תחנות מדידה הייתה בדיוק אותה שגיאה קבועה. יכול להיות גם שהייתה הטיה לא מכוונת מצד המודדים שידעו שאמורה להיות מגמת התחממות ולכן בתחנות שהראו שיש דוקא מגמת התקררות בדקו את הציוד או החליפו בציוד מדוייק יותר או בדקו שאין טעויות ברישום של הנתונים בעוד שבתחנות שבהן השגיאות נטו להתחממות אף אחד לא חשד שהציוד פגום או לא מדוייק.
ואני בכלל לא מדבר על האפשרות של סילוף מכוון של נתונים.

יעקב אמר/ה...

כבר היה לנו ויכוח על זה נדמה לי. כפי שאתה אומר - כדי שביטול מרווח השגיאה בזכות ריבוי מדידות יהיה תקף חייבים להוכיח שהשגיאה אקראית. אי אפשר להניח הנחה שהשגיאה תמיד אקראית ולהסתמך על זה ולבטל את מרווח השגיאה.
יכולות להיות עוד שגיאות שיטתיות רבות - למשל מחשב שרושם 999 בשדה שאין בו נתון, ואח"כ מסכם את זה בממוצע.
חוץ מזה לא מדובר כאן במדידות רבות של אותו דבר - כמו נניח אם היית מביא אלף טרמומטרים שונים לבדוק את הטמפרטורה ברגע זה בחדר זה - ואח"כ היית עושה ממוצע. מדובר ב 39 אלף טרמומטרים שונים (כנראה יותר) שמדדו טמפרטורות במקומות שונים ובזמנים שונים. לא ברור מאליו שהשגיאה אקראית. קח דוגמה אחרת - טרמומטר שיש לו שגיאה יותר גדולה בטמפרטורות גבוהות ופחות גדולה בנמוכות. האפשרויות אינסופיות.
לכן אני אומר שלא ניתן להגיע לתוצאה אחת חדה וברורה, וודאית. בלתי אפשרי.