Seit Tagen versuchen wir anhand offizieller Daten herauszufinden, wie sich in bestimmten Regionen Österreichs wann die Corona-Infektionen ausgebreitet haben. Denn die Berichte von Betroffenen passen einfach nicht zu den Zahlen, die öffentlich bekannt sind. Zwischendrin wurde die Darstellungs-Methodik geändert (Verstorbene und Gesundete aus den Gesmatzahlen austragen oder in sie einsetzen), dann passieren seltsame Eingabefehler. Wie kann das sein? In einem Gastbeitrag erläutert Walter Rafelsberger, Softwareentwickler und Datenanalyst, warum es zu diesem Wirrwarr kommt: Unsere Daten sind nämlich nicht öffentlich. Regierungsbehörden behandeln diese als ihren persönlichen Schatz.
Die Hochschule fährt langsam runter – der Tourismus boomt weiter
Anfang März werde ich zum ersten Mal stutzig. Als externer Lektor einer Fachhochschule in Tirol wurde ich bereits ab Februar über COVID19 und mögliche Auswirkungen informiert. Mein Hauptarbeitgeber informiert mich am 6. März, dass alle grenzüberschreitenden beruflichen Reisen einzustellen sind. Der Trubel in den Tiroler Skigebieten geht derweil unbehelligt weiter. Am 7. März unterrichte ich noch vor Ort an der Fachhochschule. COVID19 ist sonst im Alltag noch nicht so präsent, aber hier fällt auf: Die StudentInnen haben bereits die inzwischen bekannte Hust- und Niesetikette verinnerlicht, man begegnet sich mit mehr Achtsamkeit und Abstand. Es sollte einer der letzten Tage sein, an denen hier überhaupt Präsenzunterricht stattfindet. Dienstag, den 10. März, gibt man bekannt, dass ab sofort vor Ort keine weiteren Lehrveranstaltungen mehr stattfinden und man komplett auf Online-Unterricht umstellen wird.
Zu diesem Zeitpunkt gibt es in den Skigebieten in Tirol noch praktisch keine Einschränkungen. Es ist eine verwirrende Diskrepanz. Während wir durch die Sensibilisierung aus dem universitären Umfeld versuchen, ab 11. März im Bekanntenkreis Menschen zum Social Distancing zu animieren und für Risikogruppen beginnen, Versorgung in der Isolation zu organisieren, gehen die Partys in den Après-Ski-Lokalen weiter. Erst am Freitag, den 13. März, verhängt man die Chaos-Quarantäne im Tiroler Oberland, bis Sonntag, 15. März, bleiben die Skigebiete offen.
Spätestens seit diesen Tagen ist auch österreichweit COVID19 omnipräsent. Ich beobachte und versuche seitdem zu dokumentieren, wie die Krise von den Medien und Behörden kommuniziert und vermittelt wird.
Krisenkommunikation ist auch ein Kampf um die Deutungshoheit
Die Kommunikation in der Krise ist auch ein Kampf um Deutungshoheit und gegen Fake-News. An dem Wochenende um den 15. März ist die Situation in der Lombardei noch ein Ausreißer und es gibt alle möglichen Theorien, warum das so ist. Das Youtube-Video eines charismatischen Arztes im Ruhestand geht die Runde. Es ist Wasser auf die Mühlen der Beschwichtiger. In den österreichischen Medien wird ein Experte aus dem „Beraterteam der Stadt Wien für das Coronavirus“ herumgereicht. Nach einem haarsträubenden Interview voller Verschwörungstheorien in einer Lokalausgabe des Kuriers wird es still um ihn. Die Kurier-Redaktion distanziert sich später lapidar, geht aber nicht weiter auf die Inhalte ein, das Interview selbst ist online nicht verfügbar.
Es ist auch dieses Wochenende, an dem ganz Österreich auf den kommenden „Shutdown“ und #flattenthecurve vom Kanzler abwärts eingeschworen wird. Nach dem Verkennen der Situation in der Tiroler Provinz kann der „Klartext-Kanzler“ jetzt Stärke zeigen.
Wirken die Maßnahmen? So früh konnte man das gar nicht wissen
Ab Montag, 16. März, gelten österreichweit die Ausgangsbeschränkungen und die tägliche Berichterstattung konzentriert sich auf ein neues Thema: Wirken die Maßnahmen? Der Skizirkus ist beendet, dafür wird uns täglich die Zwischenzeit des Rennens gegen die Ausbreitung von COVID19 präsentiert. Dabei gilt vielen die Steigerung der Anzahl der identifizierten Neuinfektionen als Maßstab. Noch am selben Tag prescht die Kronen Zeitung vor und meint mit Verweis auf die Zahlen: „Die strengen Schutzmaßnahmen der Regierung scheinen ihre Wirkung zu zeigen.“ Am Abend heißt es dann in einer ZiB Spezial: „Es hat sich etwas verändert, es scheint zu wirken“ und man stellt anhand der Zahl der Neuinfektionen fest, dass sich die Verdopplungszeit auf drei Tage verlangsamt hat. Dieses Mantra von der scheinbar sichtbaren Verlangsamung der Verdopplungszeit wird man die kommenden Tage noch öfter hören.
Die Zahlen zeigen die Dynamik der Tests
Es ist natürlich verständlich, dass man der Bevölkerung ein Zeichen geben will, dass die harten Maßnahmen Sinn machen. Es war aber zum gegebenen Zeitpunkt aufgrund der Datenlage einfach manipulativ bis unseriös, die oben erwähnten Aussagen mit der Entwicklung der Zahlen zu rechtfertigen. Tatsächlich war es so, dass neben der Anzahl der festgestellten Neuinfektionen über das Wochenende auch die Anzahl der durchgeführten Tests nicht entsprechend gesteigert wurde. Es ist daher nicht unwahrscheinlich, dass die Zahlen eher die Dynamik der Tests als die tatsächliche Ausbreitung der Pandemie wiedergeben.
Wir haben es mit einem komplexen System mit vielen Unbekannten zu tun
Die Anzahl der Infizierten mag auf den ersten Blick ein Indikator für die Ausbreitung sein und es lassen sich dankbar einfach Graphiken produzieren, die den Verlauf suggerieren. In Wahrheit haben wir es aber mit einem komplexen System mit vielen Unbekannten zu tun: Wir kennen die tatsächliche Anzahl der Infizierten nicht und bis heute gibt es nur weit auseinanderlaufende Vermutungen zu deren Verhältnis. Die Dauer von der Infektion bis zum Auftreten von Symptomen hat eine große Spannweite. Und die Dauer von der Ausführung eines Tests bis zum Vorliegen des Ergebnisses kann mehrere Tage dauern. All das führt dazu, dass sich die scheinbar einfachen Zahlenreihen schwer bis gar nicht in Beziehung stellen lassen und gesicherte Aussagen kaum gemacht werden können.
Je mehr Tests umso mehr bestätigte Fälle
Im Lauf der Woche bis zum 21. März wird sich auch zeigen: Mit einer Steigerung der Tests steigt auch wieder vermehrt die Zahl der bestätigten Fälle. Die Argumentation mit der Verlangsamung der Steigerung ist also nicht einmal mehr so haltbar. Auch in Deutschland wird zunächst ähnlich argumentiert. Am 22. März muss sich aber auch das Robert-Koch-Institut eingestehen:
Zum Beispiel: Nord- und Südtirol
Die Problematik mit dem Verhältnis der Zahlen von durchgeführten Tests, bestätigten Fällen und im späteren Verlauf von Todesfällen lässt sich an einem Vergleich von Nord- und Südtirol ganz gut darlegen: In Nordtirol wurden bis 9. April mehr als 26.000 Tests durchgeführt, mehr als 3.000 bestätigte Fälle identifiziert und es gibt 53 Todesfälle. Das entspricht einer Case Fatality Rate (CFR) von 1,7%. In Südtirol hingegen gibt es knapp 19.000 Tests, nur ca. 1800 bestätigte Fälle und trotzdem 183 Todesfälle (Case Fatality Rate: 10,2%!). Das zeigt uns: Ausgehend von den vorhandenen Zahlen lassen sich schwer gesicherte, allgemeine Rückschlüsse auf die tatsächliche Ausbreitung und den Verlauf der Pandemie machen.
Länderübergreifende Zahlenvergleiche sind problematisch
Überhaupt lässt sich der Ausbruch der Pandemie schwer mit Durchschnittswerten z.B. über Bundesländer oder Nationen hinweg analysieren. Unterschiedliche Teststrategien und Zählweisen machen die Zahlen schwer vergleichbar. Diesbezüglich kann man den Verantwortlichen an sich erstmal keinen Vorwurf machen. Wir haben es mit einem Präzedenzfall zu tun – und es ist eine Mammutaufgabe, im Zuge dieser Krise Systeme und Zählweisen über Grenzen hinweg im Eiltempo zu vereinheitlichen. Problematisch ist es nur, wenn diese Unterschiede nicht transparent kommuniziert werden. Eine wichtige Rolle spielt dabei, wie Behörden die veröffentlichten Daten aufbereiten und dokumentieren.
In Österreich gibt es keine Datentransparenz
Die Rolle Österreichs steht dabei auf keinem Ruhmesblatt. Das „Zauberwort“ in diesem Zusammenhang hieße „maschinenlesbare Daten“ oder „Open Data“. Gemeint ist damit, wenn Behörden Zahlen und Analysen in Formaten publizieren, die unabhängige Forscher und Journalisten ohne größeren Aufwand — d.h. vor allem ohne händisches Abtippen — weiterverwenden können. Die österreichischen Behörden haben das bis heute nicht zustande gebracht. Man muss hier für technisch nicht Versierte besonders festhalten: Das kann unmöglich an technischen Hürden liegen. Die tägliche Publikation einer maschinenlesbaren Datei mit Zeitreihendaten zu Tests, bestätigten Fällen, Hospitalisierungen und Todesfällen wäre ein trivialer Vorgang.
Was bleibt: Zahlen von Ministeriumsseiten abschreiben
Weil das eben nicht geschieht, verbringen ForscherInnen und JournalistInnen täglich unnötige Zeit damit, die Zahlen manuell von den Ministeriumsseiten abzuschreiben oder mit selbstgeschriebenen Scraping-Tools auszulesen. Neben der vergeudeten Zeit ist das natürlich fehleranfällig. Das zwingt u.a. den ORF mittlerweile dazu, auf einer mehrseitigen Internetseite die Problematik rund um die Datenerhebung darzulegen. Auf der Homepage mit den täglich aktualisieren Karten und Graphiken muss man sich ebenfalls erst durch eine Liste an Hinweisen hindurchscrollen.
Datentransparenz versus Message Control
Warum eine praktikablere Veröffentlichung der Daten bis jetzt nicht geschieht, kann man natürlich nur vermuten. Jedenfalls spießt sich diese Form von Transparenz mit der gern zitierten Message Control der türkisen Regierungspartei. Das mag subtil erscheinen, aber es stellt sich auch die Frage, warum sich beispielsweise im „amtlichen Dashboard“ des Gesundheitsministeriums nur die Zahl der bestätigten Fälle findet. Die Zahlen zu Hospitalisierungen und Intensivpatienten sind nur verlinkt und müssen auf anderen Seiten gesucht werden – und die Zahl der Todesfälle scheint überhaupt nicht auf. Die Klubobfrau der Grünen ist sich jedenfalls auf Twitter nicht zu schade ein „bissi“ herablassend zu verlautbaren, „dass die beamt*innen das auf ihrer prioritätenlisten nicht an erster stelle haben“. Frei nach dem Motto: Hört’s auf zu motschgern, wir haben hier schließlich wichtigeres zu tun und retten gerade die Welt!
„Wir müssen alle Grafiken einstampfen.“
Man kann diese Aufrufe zu mehr Transparenz nicht als Nörglerei von ein paar Wichtigtuern (neben vielen anderen mich eingeschlossen, wenn man so will) auf Social Media abtun. Die Open Data Initiative des Bundesministeriums für Digitalisierung und Wirtschaftsstandort wartet dazu seit 26. März auf Antwort, „Der Ball liegt nun beim Gesundheitsministerium“. Am 27. März schreibt ein ORF-Mitarbeiter: „Das Sozialministerium hat auch noch die letzte zuverlässige Quelle für Covid-19-Daten abgedreht. Wir müssen alle Grafiken einstampfen“. In einem gemeinsamen Aufruf fordern u.a. auch Forscher der WU Wien und MedUni Graz Datenzugang und warnen vor „Blindflug“. Und es wäre auch nicht so, dass man das alles erst neu erfinden muss. Gerade das von der Pandemie schwer getroffene und ohne Zweifel auch schwer beschäftigte Italien betreibt in dieser Hinsicht eine vorbildliche Arbeit.
Der Verdacht besteht: Mit Zahlen wird Politik gemacht
Es verbleibt der fahle Beigeschmack, dass Zahlen gerne, wenn sie ins Bild passen, mitunter überinterpretierend für eine gewisse Stoßrichtung bei der medialen Meinungsmache eingesetzt werden. Und für den Kanzler sind Experten und Wissenschaft ein dankbares Vehikel, um Seriosität und Umsichtigkeit beim Beschluss von Maßnahmen zu suggerieren. In seiner Erklärung vom 3. April zur aktuellen Entwicklung zum Coronavirus beruft er sich mehrfach auf „die Zahlen“ und „Experten“. Er suggeriert dabei, dass man auf Basis dieser „Zahlen“ mit „Experten“ in der Lage ist, bestmögliche Entscheidungen zu treffen. Nur vergisst er dabei zu erwähnen, dass wir es nach wie vor in Österreich mit einem ziemlich intransparenten Chaos zu tun haben, was diese Zahlen angeht. Denn die Problematik der validen und transparenten Zahlen betrifft nicht nur die Kommunikation nach außen.
So soll das Innenministerium
erheben. Und bei einer Pressekonferenz, die eigentlich dazu dienen sollte, zu demonstrieren, wie genau man beim Tracing, der Rückverfolgung von Ansteckungsketten arbeitet, stellt sich ausgerechnet der Zeitpunkt einer Infektion einer prominent erwähnten Patientin 0 aufgrund eines Eingabefehlers als falsch heraus.
Abschließend kann man sagen: Wenn wir jetzt anfang April die Situation mit vor einem Monat vergleichen, so ist die Diskussion rund um die Qualität der Daten und den Interpretationsspielraum, den sie zulassen, immerhin angekommen. Immerhin: Sie findet sich nicht nur in Fußnoten wieder. So stellt Michael Matzenberger, Head of Data Journalism bei Der Standard, am 4. April in seiner umfassenden Analyse einleitend beinah sokratisch fest: „Bei den Corona-Zahlen stehen alle im Dunkeln“.
Walter Rafelsberger entwickelt Benutzeroberflächen für Maschinelles Lernen und ist externer Fachhochschullektor für Datenvisualisierung. Davor war er u.a. an internationalen Forschungsprojekten beteiligt, die sich mit der Analyse von Social-Media und Fake-News beschäftigten.