Dienstag, 10. August 2010

Klimamodelle auf dem Prüfstand

James Annan macht auf seinem Blog Werbung für ein neues Journal und dabei auch für einen Artikel von Julia C. Hargreaves, Skill and uncertainty in climate models, Wiley Interdisciplinary Reviews: Climate Change, 1 556 (2010). Am Beispiel der Modellrechnungen von Hansen und Mitarbeitern, mit denen 1988 drei Szenarien für eine globale Erwärmung vorgestellt wurden (Hansen J, Fung I, Lacis A, Rind D, Lebedeff S, Ruedy R, Russell G, P Stone. Global climate changes as forecast by Goddard Institute for Space Studies three-dimensional model. J Geophys Res-Atmos 1988, 93(D8):9341–9364.), zeigt sie, wie man den Skill einer Modellvorhersage untersuchen kann. Skill bezeichnet die Fähigkeit einer Vorhersage, die Beobachtungen besser zutreffen als eine Referenz. Man betrachtet das Verhältnis des Modellfehlers zum Fehler der Referenz. Zieht man von 1 dieses Verhältnis ab, erhält man den Skill. Sind Modell und Referenz gleich gut, ist das Verhältnis 1 und der Skill 0. Ist andererseits das Modell zehnmal besser als die Referenz und daher der Modellfehler ein Zehntel, ist das Verhältnis 0,1 und der Skill 0,9. Ein Skill über Null sagt also aus, daß das Modell eine bessere Arbeit leistet als eine Referenz. Hansens Modell hat für den Zeitraum 1989 – 2008 einen Skill von 0,56. Das ist recht gut, wenn man bedenkt, daß es ein recht frühes Modell war, mit Szenarien, die inzwischen deutlich überholt sind. Es gibt noch mehr dazu zu schreiben.
Globale Temperaturdaten (monatlich) HadCRUT3 (schwarz) gegen Modellprojektion
Szenario B aus Hansen et al. 1988 (blau) und Persistenz als Vergleich (rot),
durchgezogene Linien geben Trend über 20 Jahre. Aus Hargreaves 2010.



Für das normale Publikum ist nur die Tatsache von Bedeutung, daß das Modell Skill hat. Denn natürlich liegt die Modellprojektion nicht genau auf den Beobachtungen - der Trend über 20 Jahre ist im Modell 0,026 und bei den Beobachtungen 0,018 Grad/Jahr. Modell und Beobachtungen haben einen Fehler, und eine Übereinstimmung im Rahmen des Fehlers sagt aus, daß die Beobachtungen das Modell noch nicht widerlegen, auch wenn die Daten Abweichungen zeigen. Aber man kann dann immer noch sagen, daß die Übereinstimmung nichts aussagt, wenn man auch ohne Modell die Beobachtungen hätte vorhersagen können. Die wichtigsten Möglichkeiten sind dabei Persistenz und Extrapolation, also der aktuelle Zustand besteht fort oder der bestehende Trend wird fortgeschrieben.

1988 konnte man für zurückliegende 20-Jahreszeiträume verschiedene Trends sehen, aber im Mittel war die beste Vorhersage kein Trend, also Persistenz. Und gegenüber der Persistenz zeigt die Modellprojektion von Hansen einen Fehler (eine Fehlerquadratsumme), der weniger als halb so groß ist wie bei der Persistenz im Vergleich zu den Beobachtungen. Man kann sogar verstehen, was zu dem bestehenden Fehler beigetragen hat. Und an dem Punkt werden Vergleiche zwischen Modellen und Beobachtungen erst richtig interessant.

Hansen und Mitarbeiter hatten unter anderem den Einfluß von Aerosolen nicht berücksichtigt, die einen abkühlenden Effekt beitragen. Weiterhin wurde in dem Modell eine eher hohe Klimasensitivität angenommen. Das Modell erzeugt bei einer Verdopplung der CO2-Konzentration einen Temperaturanstieg von 4,2 Grad, deutlich über dem mittleren, besten Wert von 3. Und das Modell ist im Vergleich zu späteren Modellen relativ primitiv mit einem sehr vereinfachten Ozean, der zu schnell auf eine Erwärmung reagiert. Das Modell zeigt also aus nachvollziehbaren Gründen eine schnellere Erwärmung als sie sich aus den Beobachtungen ergibt.

Dies ist nicht der erste Vergleich von Modellergebnissen und Beobachtungen, dazu kann man hier und dort was nachlesen, aber hier wurde über eine rein qualitative Betrachtung hinausgegangen. Man könnte auch noch zu bedenken geben, daß der Vergleich noch etwas schmeichelhafter ausgefallen wäre, wären Daten von GISS oder RSS verwendet worden und daß auch die Hereinnahme des Jahres 2009 den Vergleich etwas besser für Hansens Modell gestaltet hätte. Aber das alles bedeutet erst mal nur, daß für den Vergleich noch Fehler in den Beobachtungen zu berücksichtigen sind und die Tatsache, daß die Ergebnisse durch den Untersuchungszeitraum beeinflußt werden - je länger er ist, desto besser. Bei Zeiträumen unter 10 Jahren wird ein solcher Vergleich wohl bedeutungslos.

Es gibt noch einen Punkt zu beachten. Die Modelläufe sind keine echten Vorhersagen im Sinne einer Wettervorhersage. Jeder Modellauf stellt die Realisierung einer möglichen Abfolge von Wetterzuständen dar. Man könnte das gleiche Modell mit im Rahmen der Unsicherheit veränderten Anfangs- und Randbedingungen laufen lassen und erhält eine andere Abfolge von Wetterzuständen. Die Modellaussage ist aber dadurch keine andere, sondern durch solche wiederholten Läufe fährt das Modell nur durch den Raum möglicher Abfolgen von Wetter, die mit diesem Zustand des Klimas verträglich sind. Unterschiede in einzelnen Jahren zwischen Modell und Beobachtungen sind daher bedeutungslos. Vergleichen kann man nur Trends des Modells und der Beobachtungen über längere Zeiträume. Berücksichtigt man dies nicht in so einem Vergleich von Modell und Beobachtungen, erleidet man Schiffbruch.

Keine Kommentare: