23 בפברואר 2010

המט-אופיס: לחשב הטמפרטורות מחדש.


המט-אופס – השרות המטאורולוגי הממשלתי של בריטניה, מציע לארגון המטאורולוגי העולמי - WHO – שייעשה חישוב מחדש של הטמפרטורות העולמיות. החישוב החדש צריך להיות שקוף לחלוטין, פתוח לביקורת ומבוצע בשיטות הכי בדוקות ואמינות שאפשר, בצורה שתוצאותיו יהיו מקובלות על כולם, ללא עוררין.
הוא צריך לכלול את הדברים הבאים:
- בסיסי נתונים בסיסיים ובדוקים, פתוחים ומשותפים לכול.
- שיטות חישוב שמפורטות בצורה מלאה בספרות ונתונות לבדיקה וביקורת.
- סט של הערכות בלתי תלויות של הטמפרטורות שיבוצעו על ידי קבוצות  אחדות של חוקרים, בצורה בלתי תלויה, ובשיטות מגוונות.
- תיעוד מלא של תהליך הבדיקה והביקורת שיגביר את האמון בתוצאות.
- הערכה ופירוט של גורמי אי הודאות הקשורים למדידות עצמן, ואי תאימויות של זמן ומרחב.

בעצם המט-אופיס – שהוא בעל הבית והשותף של ה CRU (יחידת חקר האקלים של אוניברסיטת מזרח אנגליה) – מודה שסט הטמפרטורות שה -CRU   פרסם עד עכשיו אינו עומד בכול הקריטריונים הנ"ל. הם לא חשפו את הנתונים, לא פירטו מספיק את שיטות החישוב, סירבו לפרסם את קוד המחשב שמשמש אותם לחישוב, ולא עמדו בסטנדרטים של בידוק ובקרת איכות.
בעצם המט-אופיס מודה במה שהספקנים אמרו כול הזמן: סט הטמפרטורות הזה לא תקין ולא אמין.

לפי דעתי האישית – המשימה המתוארת היא בלתי אפשרית. פשוט לא קיימות מדידות היסטוריות, 100 או 150 שנה לאחור, שנעשו ברמת דיוק שאפשר לדלות משם הפרשים של עשיריות מעלות. נתונים שלא קיימים אי אפשר להמציא או לשפר בעזרת שיטות סטטיסטיות. ההנחה שאפשרי לדעת את טמפרטורות העבר ברמת דיוק של עשיריות מעלות היא מגוחכת.
אני צריכים לחיות עם מה שיש – עם המידע הבלתי מדויק שקיים – אין אחר. והמדענים צריכים להפסיק לטעון שהם יודעים את אשר לא ניתן לדעת. הם מעמידים את עצמם באור מגוחך.
יעקב
  

16 תגובות:

איל אמר/ה...

הבעייה היא לא מדידת הטמפרטורות. הרי רוב המדענים טוענים שאכן יש עלייה במשך המאתיים שנה האחרונות מאז תום תקופת הקרח הקטנה..
השאלה החשובה - מהו הגורם?

יעקב אמר/ה...

יש הרבה שאלות.
השאלה מה עשו הטמפרטורות (כיצד השתנו) מאז שהחלו למדוד אותן במכשיר יחסית מדויק - הטרמומטר - היא שאלה חשובה גם כן.
הבעיה היא שלא ניתן לדעת מעבר לרמה של דיוק די גסה, למרות שיש מדידות.
לפי דעתי - על פי המידע שקיים, אפילו לא ניתן לאמור בוודאות שהייתה עליה בטמפרטורות. מרחב חוסר הדיוק יותר גדול מההפרש ב0.6 מעלות שטוענים שיש. ניתן לאמור בודאות רבה יותר דבר אחד: לא הייתה עליה גדולה או חריגה או קאטאסטרופאלית בטמפרטורות.
באשר לשאלה מה גרם לכך - זו שאלה אחרת, אך היא לא גורעת מחשיבות השאלה הראשונה.

אנונימי אמר/ה...

יעקב, רק לחדד נקודה אחת. ניתן לגלות באמצעות ציוד שטעות הדגימה שלו היא מעלה אחת שינויים של עשירית מעלה. כמובן שלא ניתן לעשות זאת במדידה אחת אבל כאשר מדובר באלפי מדידות זו לא בעיה.
נניח שיש לנו 1000 תחנות מדידה והדיוק של כל אחת מהן הוא מעלה (התוצאה הנמדדת יכולה להיות חצי מעלה יותר או פחות מהטמפרטורה האמיתית כך שיש טווח של מעלה אחת בין כל הטמפרטורות האפשריות על סמך המדידה). אם אנחנו עושים ממוצע בין כל המדידות אנחנו עושים גם ממוצע בין כל הסטיות. סטטיסטית רוב הסיכויים שממוצע הסטיות יהיה מאוד קרוב ל0. כדי לבדוק את עצמי בדקתי באקסל רשימות של 1000 מספרים אקראיים ומה טווח הערכים של הממוצע שלהם. הסטייה בממוצע מהערך הצפוי הייתה בסביבות 5% לכל היותר. ז"א ש1000 מדידות עם טווח סטייה של מעלה יתנו ממוצע שיהיה רחוק מהטמפ' האמיתית כ5 מאיות מעלה לכל היותר. אם המדידות של 1000 התחנות האלו יראו באופן עקבי שהממוצע עלה בעשירית מעלה אפשר בהחלט להניח שזה משקף את השינוי האמיתי. כמובן שאם מי שמפרסם את התוצאות האלו הוא נוכל שמשמיד את הנתונים המקוריים, מזייף נתונים ומנסה להרוס את היריבים שלו אז לא אכפת לי מסטטיסטיקה אני לא מאמין לו עד שיבוא גורם אובייקטיבי ויבצע מדידות בלתי תלויות ומבוקרות. האפשרות למדוד שינויים בחלקיקי מעלה גם לא ממש משכנעת אותי שהתחממות של חצי מעלה היא קטסטרופה.
אני מקווה שההערה שלי תתקבל בברכה. ההבדל המהותי ביננו לבין החממיסטים זה שאנחנו מתמקדים במציאת הטענות הנכונות, לא הטענות שמחזקות את העמדה שלנו.

ניר

יעקב אמר/ה...

"ניתן לגלות באמצעות ציוד שטעות הדגימה שלו היא מעלה אחת שינויים של עשירית מעלה."
אינני מסכים איתך.
אותי לימדו שאם יש לך שתי מדידות, וכול אחת היא +- נגיד 1% , מרווח השגיאה של סיכום שתי המדידות (או הממוצע) הוא סיכום השגיאות כלומר +- 2% .
הטענה שכאילו מדידות רבות מקזזות זו את זו ונותנות ממוצע נכון היא אמונה טפלה (סליחה על הביטוי החזק).
אין לך כול ביטחון שהשגיאות מקזזות אחת את השנייה. אין לך מידע על כך שהשגיאה אקראית (כמו בדוגמה שלך עם אקסל). בהעדר מידע על אופי השגיאה, הדרך ההנדסית (המעשית) הנכונה לטפל בבעיה היא לחשב את המקרה הגרוע ביותר - כלומר - הצטברות השגיאות. זה יתן לך את מרווח השגיאה האפשרי של התוצאה.

יעקב אמר/ה...

יותר גרוע.
אין לנו מושג ירוק מה מירווח השגיאה של המדידות השונות.
זה שונה מאשר מקרה בו ערכנו מספר גדול של מדידות עם מכשיר מסויים מוגדר וידוע, שמרווח השגיאה שלו מוכר.
פה יש לנו מדידות ממכשירים רבים ושונים, בנקודות רבות בזמן ובמרחב, ואין לנו מידע על מידת הדיוק של המכשירים, של הרישומים, של הדיווחים, של כלום.
ועוד יותר גרוע - תחנות המדידה החליפו מקום (ולא תמיד הקפידו לדווח על כך), החליפו מכשירים, דיווחו לפעמים כן ולפעמים לא (כלומר יש מרווחים לא מדווחים).
לטעון שאפשר מבליל רב של נתונים בעלי איכות ירודה ובלתי ידועה להפיק תוצאה מדויקת באמצעים סטטיסטיים זו טענה של מתמטיקאי, אשר משחק עם מספרים. אין לתוצאה משמעות מעשית - אלא אם לוקחים בחשבון מרווחי שיגאה גדולים, הרבה מעבר ל"אות" שגילינו (עשיריות של מעלה).

יעקב אמר/ה...

המט-אופיס הביע את דעתו, לפני שנעשה המחקר החדש, שהתוצאות לא תהינה שונות באופן מהותי מהתוצאות העכשויות.(של CRU או GISS ). בכך גילה המט-אופיס שדעתו משוחדת.
אני אינני יודע מראש מה יהיו התוצאות של מחקר חדש (אם יתבצע). אבל אני כן חושב דבר אחד, מראש: מרווח השיגאה של התוצאות החדשות לא יכול להיות בסדר גודל של עשיריות מעלה.

יעקב אמר/ה...

ובמקרה מצאתי את הקומנט הזה (בנושא דיוק המדידות):
WUWT- Steve Keohane (07:24:22) :

By the way, I am retired from an engineering career specializing in temperature measurement, analysis and control where 3-sigma was <0.1°F, 25 years ago. The data used for global temperature determination is a joke, look at surfacestations.org, and that is about as good as it gets for the planet. It doesn't matter what you do to bad data, it's bad data.

אנונימי אמר/ה...

יעקב, אנא הפרד בין האמינות של הנתונים שהחממיסטים מזייפים (0 נכון למצב הנוכחי של החקירות והגילויים) לאפשרות למצע שגיאות באמצעות מדידות מרובות.
אני רוצה לחדד מאוד את מה שאני אומר ומה שאני לא אומר:
אם מחליפים ציוד מדידה או משנים את שיטת המדידה או המקום שלה ומייד אחרי השינוי במדידה יש שינוי בתוצאות כמובן שאין לשינוי הזה שום משמעות וכל בר דעת (שדתו אינה חממיסטית) יסרב לקבל מדידה כזו כבדל הוכחה לשינוי בטמפרטורה.
אם אין שום אפשרות מעשית לקבוע טווח ריאלי לטעות המדידה של ציוד מדידה אז אין שום דרך לשפר את איכות המדידה באמצעות מדידות נוספות. העניין הוא שטענה כזאת בעצם אומרת שאין שום משמעות למדידה והציוד לא מסוגל להבחין בין 0 מעלות ל50 מעלות. זו טענה קצת קיצונית אפילו אם אנחנו מדברים על ציוד גרוע במיוחד.
כיול של ציוד מדידה לא רלוונטי כאשר אנחנו מודדים שינוי ולא ערכים מוחלטים. אם יש לי ציוד שבאופן עקבי נותן תוצאה שגבוהה יותר ב5 מעלות זה ציוד מדוייק מבחינתי כי בכל המדידות שלו התוצאה תהיה גבוהה יותר ב5 מעלות ואם יש שינוי אמיתי הוא ישתקף בצורה מדוייקת במדידות. מה שפוגע בדיוק של מכשיר זה הטווח של הטעויות וככל שהפיזור של הטעויות יותר קרוב להתפלגות אקראית כך המכשיר פחות מדוייק. כך שהחישובים שעשיתי לקחו בחשבון את המקרה הגרוע ביותר. אם הייתי בוחר התפלגות אחרת, למשל ש90 אחוז מהערכים נעים סביב חצי מעלה יותר ו10 אחוז סביב חצי מעלה פחות היינו מקבלים כיול לא נכון של המכשיר (שלא מפריע לנו) אבל ממוצע מדוייק יותר.
לימדו אותך לא נכון. אמנם יש אפשרות תיאורטית שאם תבצע מדידה שוב ושוב, טעות המדידה, במקרה, תהיה קיצונית ודומה בכל מדידה אבל זה רלוונטי רק במספר קטן מאוד של מדידות. כשמדובר באלפי מדידות הסיכוי שתסריט כזה יקרה הוא זניח לחלוטין, בדיוק כמו הסיכוי שמ1000 האנשים שהתקשרו אליהם לסקר לפני הבחירות 900 הם במקרה מצביעים של מפלגת עלה ירוק. האפשרות הסבירה היא שהמדגם האקראי הזה ישקף באופן שקרוב למציאות את התפלגות המצביעים האמיתית וככל שתבצע יותר בדיקות למדגם הדיוק שלו ישתפר. שים לב שאם תבצע רק מדידה אחת בסקר התוצאה שתקבל היא שמפלגה אחת מקבלת 120 מנדטים וכל האחרות 0. זה אומר שטווח השגיאה של הסקר הוא 100 אחוז. כמובן שגם הסקרים הטועים ביותר שנעשו אי פעם היו קרובים הרבה יותר למציאות מ100 אחוז טעות.

ניר

יעקב אמר/ה...

"אם אין שום אפשרות מעשית לקבוע טווח ריאלי לטעות המדידה של ציוד מדידה אז אין שום דרך לשפר את איכות המדידה באמצעות מדידות נוספות."
אין אפשרות לקבוע טווח ריאלי לשגיאה לציוד מהעבר שכבר לא קיים. אני לא טוען שמכשירי העבר לא אמינים לחלוטין. אני רק אומר שטווח השיגאה שלהם היא +- 3-5 מעלות לפחות.(ראה surfacestations.org )
ניתן לעשות מדידות יותר מדויקות עם מכשירים חדשים, תחת בקרה יותר טובה, לא ניתן לעשות זאת רטרואקטיבית, לגבי מדידות העבר.

"כיול של ציוד מדידה לא רלוונטי כאשר אנחנו מודדים שינוי ולא ערכים מוחלטים."
כיול לא רלוונטי כאשר אתה בודק שינויים לאורך זמן במכשיר אחד. אבל כאשר אתה עושה "הומוגניזציות" על פני תאי שטח - הכוללים מכשירים רבים - הכיול כן רלוונטי - אחרת - אין המכשירים השונים מדברים באותה שפה.

בנושא גודל מדגם - ככול שהמדגם גדול יותר השגיאה יותר קטנה - שוב - זה נכון בתנאים מסוימים. כפי שכתבתי - אם תערוך 1000 מדידות של אותו דבר באמצעות אותו מכשיר - זה מקטין את מרווח השגיאה. אבל אם תערוך 1000 מדידות באמצעות מכשירים שונים, במקומות שונים בעולם - ריבוי המדידות פועל לכיוון הקטנת השגיאה, אבל ריבוי המכשירים השונים וריבוי המקומות השונים פועלים לכיוון של הגדלת השגיאה האפשרית. לדעתי - ההשפעה של ריבוי מכשירים שונים ומיקומים שונים - גוברת על ההשפעה של ריבוי מדידות - בכיוון של הגדלת מרווח השגיאה.
זה לא שמדדת 1000 פעמים את הטמפרטורה בצפת ב 22.12.1948 עם אותו טרמומטר. את הטמפרטורה בצפת, בתאירך הנ"ל מדדת מדידה אחת ויחידה. ובטבריה מדדת עם טרמומטר אחר, ובראש פינה עם שלישי, ואח"כ אתה עושה ממוצעים שלהם, על פני התאריכים והמקומות רבים. זה מקרה שונה מהמקרה של הבאת כדוגמה.
ולבסוף יש את חוסר הידיעה: אנו לא יודעים מה מרווח השגיאה והכיוון שלו במדידות העבר. מה שאיננו יודעים - לא צריך להניח שהוא "אקראי" - אקראי ובלתי ידוע הם דברים שונים.

ובאשר לדוגמה שאתה מביא - סקרי דעת הקהל - זו דווקא דוגמה טובה - כי הם ידועים בחוסר אמינותם. הם מפספסים את תוצאות האמת די בגדול, ודי הרבה פעמים. זה מראה שריבוי דגימות אינו ערובה לדיוק.

יעקב אמר/ה...

על דרך ההלצה ניתן לאמור שדיוק בטמפרטורות הוא כמו דיוק הסקרים - +- 10% ...
זה דיוק - איך לאמור... דיוק "רגשי" (על משקל אינטליגנציה רגשית). זה לא דיוק מדעי...
אני לא אומר שמדידות העבר חסרות ערך... אני אומר שהן מלמדות בערך - שלא היו שינויים של ממש בטמפרטורות. הפרשים של עשיריות מעלה אחדות לכאן או לכאן לא משמעותיים נוכח שיטות המדידה.

יעקב אמר/ה...

וגורם נוסף: החלפת מכשירים. גם אם יש רקורד אחד ארוך, של תחנת מדידה אחת - סביר להניח שבמשך עשרות רבות של שנים החליפו את המכשירים בתחנה (למכשיר יותר חדש מאותו סוג, או אפילו למכשיר מסוג אחר). בין החלפה להחלפה בוודאי עשו כיול מחדש מדי פעם (אם לא עשו - אוי ואבוי). כול זה לא מתועד תעוד מלא ומפורט. לכן - גם בחישוב מגמות בתחנה בודדת יש מרווחי אי דיוק גדולים.

אנונימי אמר/ה...

שוב, אני האחרון שיבוא ויטען שהמדידות לאורך השנים שזויפו, סולפו והועלמו במתכוון אומרות משהו שניתן לסמוך עליו מלבד זה שלחממיסטים אין קייס. אני מדבר על נקודה אחת, האפשרות לשפר את הדיוק של מדידות באמצעות ריבוי מדידות. את זה אמרת שאי אפשר לעשות וזה פשוט לא נכון.

1. אתה לא יכול לדבר על זה שאין שום טווח למכשירי מדידה ואז לדבר על טווח של 3.5 מעלות. גם אם הטווח הוא 20 מעלות לכל כיוון יש טווח. שימוש בריבוי מדידות ישפר את הדיוק מ20 לפחות רק במצב הקיצוני שבו אין שום טווח וכל מדידה יכולה לתת תוצאה מ0מוחלט עד אינסוף אז אין שום משמעות לריבוי מדידות אבל גם אין שום משמעות למדידה עצמה, היא לא מודדת כלום.
2. כל עוד כל המכשירים שלך מודדים את אותה יחידה לכיול אין חשיבות כשמחפשים שינויים. אם כולם מצביעים על ירידה של מעלה מה זה משנה אם זו ירידה מ30 מעלות או מ0? בכל מקרה הממוצע ירד במעלה.
3. אין הבדל בין 1000 מדידות בדיוק באותו מקום ל1000 מדידות במקומות שונים. המיצוע הוא אותו מיצוע והשגיאה הולכת וקטנה ככל שהמדגם גדל. אני לא מכיר את החישובים שנעשו תחת הכותרת הומוגניזציה וזה לא שייך. אין לי מחלוקת איתך שכל הכרפים ומקלות ההוקי ואלות הבייסבול הם פיברוקים חסרי משמעות. אני רק טוען שממוצע של 1000 תחנות מדידה יכול למדוד שינוי בטמפרטורות ברמת דיוק הרבה יותר גבוהה מרמת הדיוק של תחנה בודדת.
הדוגמה שאני מביא וצר לי שאתה מתעקש לתת לה פרשנות מגוחכת מדברת על זה שסקר שידגום רק אדם אחד יגיע בהכרח לתוצאות אבסורדיות. סקר של 1000 אנשים יתן תוצאה הרבה יותר קרובה למציאות. במפה הפוליטית של מדינת ישראל יכול להיות שטעות קטנה בסקר תגרום לזה ש2-3 מנדטים שעברו מגוש אחד לשני ישנו את המפה הפוליטית. זה לא אומר שהסקר לא מדוייק זה רק אומר שטעות הדגימה הקטנה שלו יכולה להיות משמעותית מאוד מבחינת ההשלכות הפוליטיות שלה. מידי פעם הסקרים מפקששים ביכולת שלהם לקבוע מי יהיה ראש הממשלה הבא אבל אף פעם לא קרה שסקר קבע שמפלגה תקבל 20 מנדטים והיא קיבלה בפועל 5
ניר

יעקב אמר/ה...

טוב, לא נותרה הרבה מחלוקת לדעתי.
אני לא חושב שהנתונים (מדידות העבר) הם חסרי משמעות. אני רק אומר שלדעתי מרווח השגיאה גדול בסדר גודל אחד ביחס לאות שהם טוענים שגילו. כלומר - מרווח שאני מעריך (מוצץ מהאצבע) בכ 3-5 מעלות, ביחס להפרש של 0.6 מעלות.
ה 3-5 מעלות לקוח מתקן השרות המטאורולוגי האמריקאי, שקובע שזה הדיוק של תחנות ממוקמות בצורה לא נכונה - ו 84% מהתחנות שואטס סרק ממוקמות לא נכון לפי התקן.

אני מבין (אני חושב) את אשר אתה אומר על ריבוי נתונים - המשפרים את הדיוק - ומסכים - בתנאים שציינתי למעלה. אני רק מציין שריבוי המדידות של הטמפרטורה נעשה במקומות רבים, לאורך שנים רבות, ובמכשירים שונים - וכול אלה מגדילים את מרווח השגיאה.
בזמן שאני מבין ומקבל את ההסבר שריבוי מדידות מקטין את מרווח השגיאה - הדבר נכון אם כול שאר המשתנים נשארים קבועים, ורק מספר המדידות משתנה.
המצב עם הטמפרטורות הוא הרבה יותר מסובך ו"מלוכלך" כך שעם ריבוי המדידות מתרבים גם הרעשים.
אין פה מחלוקת של ממש בינינו, אולי יש קצת על גודל המרווח... אני לא חושב שהמדידות חסרות ערך, כאמור, אני רק לא קונה שההפרש של 0.6 מעלות +- נניח 3 - מצביע על משהו ממשי. זה אומר שהטענה שהטמפרטורות עלו - מידת המוצקות שלה, או חוזקה - לא גדול. יכול להיות שעלו, יכול להיות אפילו שיש הסתברות של יותר מ 50% שהייתה עלייה, אבל לא הרבה יותר מ 50%.
באתר זה:
http://hadobs.metoffice.com/hadcrut3/diagnostics/comparison.html
הם מציירים בגרף מרווח שגיאה של כ 0.4 מעלות. אני חושב (ואני סתם מעריך, אני לא חוקר) שמרווח השגיאה יותר גדול, כאמור.

יעקב אמר/ה...

אם נמשיך את הדוגמה של הסקר לבחירות - לא תמיד הגדלת המידגם משפרת את הדיוק. אם אתה בטעות נמצא בבני ברק ןמכניס עוד ועוד אנשים משם למדגם - הדיוק שלך יורד, לא עולה - בגלל שהבחירה לא אקראית. הגדלת מידגם מגדילה את הדיוק רק אם אתה יודע שההגדלה אקראית. אבל לפעמים אתה לא מודע או לא יכול לדעת אם הגדלת את המדגם באופן אקראי או לא. במקרים כאלה אתה חייב להניח מרווחי שגיאה יותר גדולים.
במכשירי מדידה פיסיקליים יש לעיתים קרובות תופעה של זחילה או שחיקה - כך שהדיוק שלהם יורד עם הזמן ועם מספר השימושים. והשגיאה היא לא אקראית, היא תמיד לכיוון אחד. במכשיר כזה - המדידה הבודדה הראשונה עשויה להיות יותר מדוייקת ממוצע של 1000 מדידות.
הטענה שריבוי מדידות מגדילה את הדיוק אינה אוניברסלית - היא תלויה בפרטי המקרה (אם השגיאה אקראית). אם אתה לא יודע בדיוק את טיב השגיאה האפשרית - אתה לא יכול להניח מראש שהשגיאה אקראית, וריבוי תוצאות משפר את הדיוק. במצב חוסר ידיעה אתה חייב להניח מרווח שגיאה יותר גדול - למקרה הגרוע ביותר.

שרמט אמר/ה...

המט-אופיס הוא לא הבעל הבית של
CRU . זה בערך כמו לאמר שהשרמ"ט הוא בעל הבית של המכון למדעי כדור הארץ באוניברסיטה העברית
מאיפה הבאת את זה???

יעקב אמר/ה...

אינני יודע בדיוק. לפי הבנתי ה CRU ממומן לפחות חלקית, ופועל תחת חסות ה מט-אופיס.
אינני יודע בדיוק מה היחסים בין ה CRU, אונ' מזרח אנגליה, מרכז הדלי והמט_אופיס. אנ גם לא חושב שזה נורא חשוב לדעת זאת. יש קשר קרוב מאד בין כול המוסדות האלה.