Wieviel wissen wir überhaupt?

Die Corona-Statistik als Lehrstück über ein Güteniveau, dem unsere Daten noch lange nicht entsprechen

10.04.2020 | 12 Minuten

Die Debatte über eine Lockerung der Beschränkungen des öffentlichen Lebens wälzt sich durch die Medien und gewinnt an Tempo. Gleichzeitig entbrennt ein Expertenstreit über erste Zwischenergebnisse aus der Feldforschung, die sich vor ihrer Veröffentlichung zumindest keine Zeit lassen konnten, von der Fachwelt auf Herz und Nieren geprüft zu werden. Insgesamt aber zeichnet sich im Land der Möchtegern-Digitalisierung ein Daten-Supergau ab.

Statistischer Alptraum

Das Robert-Koch-Institut (RKI) muss schon einmal berichtete Zahlen regelmäßig korrigieren, weil Nachzüglermeldungen die alten Stände obsolet machen. »Dem RKI werden täglich neue Fälle übermittelt, die am gleichen Tag oder bereits an früheren Tagen an das Gesundheitsamt gemeldet worden sind.«, heißt es in den Bildunterschriften der täglichen Berichte. Auf dem zentralen Corona-Dashboard steht sogar zu lesen: »Gesamtplus der Fälle zum Vortag verteilt sich auf versch. Tage (orangene Balken) aufgrund des Übermittlungsprozesses«. Es scheint, als handele es sich beim amtlichen Meldechaos weniger um ein erkenntnisorientiertes Monitoring als um eine widerwillig erfüllte Dienstpflicht. Zur ohnehin geringen Validität der Daten gesellen sich noch Veränderungen der Messbedingungen mitten Prozess. Für Statistiker käme das einem Alptraum gleich: Statt nur weißer Kugeln sollen jetzt weiße Kugeln und blaue Würfel gezogen werden; die Ergebnisse der neuen Stichprobenziehung werden aber allerorten munter mit den alten Resultaten vermengt. Das Magazin Quarks weist zusätzlich auf eine Darstellungsproblem hin: »Die gemeldeten Fälle werden häufig als Diagramm dargestellt und zeigen eben eine solche Kurve. Dabei werden die gemeldeten Fälle schlicht zusammengezählt – ab einer gewissen Zeit überdramatisiert das. Denn wer die gemeldeten Fälle nur zusammenzählt, der vernachlässigt alle gesunden Patienten.«

Viel wichtiger als die kumulierte Summe aller positiven Testergebnisse wären nämlich die täglichen Zahlen der vermutlich akut Infizierten. Erst daraus ließe sich eine aussagekräftige Kurve bilden, die einen Vergleich mit bereits bekannten Wachstumsfunktionen, etwa der Gompertz-Funktion, zuließe. Das Robert-Koch-Institut berichtet allerdings erst seit dem 30. März 2020 auch die Zahlen von Genesenen, die allerdings nötig wären, um aus der Zahl kumulierter Positiv-Tests die Zahl der vermuteten Akutfälle zu erhalten — allerdings nur als Schätzwert. Eine verbindliche Erhebung der Genesenen scheint zu fehlen. Unklar bleibt darüber hinaus, ob die Zahl der Testungen auch wiederholte Tests an denselben Personen umfasst und demzufolge auch die Negativ-Resultate der Genesenen abbildet. Überhaupt leidet die Corona-Statistik gänzlich an transparenten Metainformationen zum Zustandekommen der Fallzahlen.

Mediale Irreführung

Denn statt nur die Zahl positiver Labortests amtlich zu melden, müssten, genauso verbindlich und idealerweise auf demselben Meldeweg, die Zahl und örtliche Verteilung aller vorgenommenen Tests bekannt gemacht werden. Das Robert-Koch-Institut berichtet erst seit seinem Tagesreport vom 1. April gelegentlich darüber — allerdings nicht tagesscharf, so wie bei den Zahlen der neuen Positiv-Ergebnisse, sondern zu Wochen zusammengefasst und noch dazu jeweils aus einer verschiedenen Zahl von Meldequellen: Am 8. April hieß es beispielsweise, in Kalenderwoche 12 hätten mehr Labore ihre Testzahlen durchgegeben als in Kalenderwoche 13 und die Zahlen aus Woche 14 kämen wieder von einer anderen Menge Labore. Deren Arbeitswoche hat noch dazu unterschiedlich viele Tage, daneben zeigt sich mehr als ein Drittel der Labore nicht mit ausreichend Ressourcen für Corona-Tests ausgestattet.

Insgesamt hängt die Zahl der neuen Fälle pro Tag hierzulande schlicht und ergreifend weniger von der Ausbreitung des Virus SARS-CoV-2 ab als vielmehr von den übrigen Umständen, unter denen positive Testergebnisse entstehen. Als unverantwortlich muss es deshalb gelten, wenn RKI-Präsident Lothar Wieler an einem Montagmorgen Optimismus verbreitet — obwohl er nur zwei Sätze zuvor feststellte, dass die Zahlen vom Wochenende erst bis Mittwoch eingehen werden.

Methodischer Bankrott

Weil die Güte der Daten sich so miserabel ausnimmt und weil noch dazu niemand seriös abschätzen kann, wie hoch die Dunkelziffer derjenigen Menschen liegt, die sich zwar mit dem Virus infiziert haben, aber keine Symptome verspüren oder das doch tun und dennoch keinen Arzt aufsuchen oder auch das tun und aufgrund von Kapazitätsengpässen nicht oder erst spät getestet werden, lässt das Virus sich weder in seiner Verbreitung noch in seiner Gefährlichkeit wirklich seriös fassen. Das Robert-Koch-Institut schätzt dennoch täglich eine aktuelle Basisreproduktionszahl ab, die viele Experten für den Schlüsselwert halten, um die Epidemie in den Griff zu bekommen. Gestern lag sie bei 1,1: Jeder Erkrankte stecke im Schnitt also 1,1 weitere Personen an. Wie aber lässt sich das verlässlich sagen, da doch so gut wie keine gesicherten Erkenntnisse über SARS-CoV-2 vorliegen? Vor dem Hintergrund des methodisches Chaos‘ kann jeder konkrete Wert, sei es der Prozentsatz aus Heinsberg oder eine statistische Schätzung auf der Basis von Todeszahlen, nur trügerische Präzision vorgaukeln, aber nicht zur Erkenntnis beitragen.

Gestern nun kündigte das Robert-Koch-Institut eine für Deutschland repräsentative Antikörper-Studie an und gab damit zu, welche Antworten die derzeit gehandelten Daten eben nicht geben können: »die tatsächliche Verbreitung, Immunität, der Anteil asymptomatische Infektionen, die tatsächliche Sterberate und Risikofaktoren für einen schweren Verlauf«. Doch auch dieses Unterfangen dürfte kaum weitere Aufklärung bringen: Erstens lassen Antikörper gegen SARS-CoV-2 sich erst etwa zehn Tage nach einer Infektion überhaupt nachweisen. Deshalb können Menschen, bei denen der Antikörper-Test nicht anschlägt, zweitens trotzdem akut infiziert sein. Drittens teilen die identifizierten Antikörper ihr Alter nicht mit. Eine zeitliche Rekonstruktion der Virus-Verbreitung und damit die rückblickende Berechnung einer tagesscharfen Basisreproduktionszahl könnte also auf Basis dieses Materials ebenfalls wieder nur mit Schätzmodellen erfolgen.

Wissenschaft, nicht Magie!

Deutschland täte gut daran, im Rahmen der Corona-Bewältigung auch wieder viel stärker über wissenschaftliche Güte zu sprechen. Große Fallzahlen ergeben noch keine sauberen Einschätzungen, erst recht nicht, wenn die Testbedingungen sich untereinander kaum vergleichen lassen oder gar nicht erst bekannt sind. Die Kritik, die den Machern der Studie aus Heinsberg entgegenschlägt, müsste sich zu einer grundsätzlichen Skepsis gegenüber eindrucksvollen Resultaten und schnellen Schlussfolgerungen auswachsen. Auch die scheinbar so entscheidende Basisreproduktionszahl birgt die Gefahr, eine komplexe Bedrohung viel zu stark zu vereinfachen: Sie bildet ja nicht nur das Verhalten einer einzelnen Einheit ab, nämlich des Virus‘, sondern sie resultiert aus einer Ereigniskette mit multiplen Einflussfaktoren, die vom individuellen räumlichen Verhalten eines Menschen über seine Infektionsvermeidungsstrategie, die Übertragungswahrscheinlichkeit auf verschiedenen Wegen und die Anfälligkeit des Patienten bis hin zur Entscheidung für oder gegen einen Test und dessen Fehlerwahrscheinlichkeit reichen.

Mit einer aktuellen Meldung gerät sogar eine wesentliche Grundannahme ins Wanken: nämlich dass einmal erkrankte Menschen für eine bestimmte Dauer Immunität dagegen erlangten. Aus Südkorea wird aktuell eine Wieder-Infektion einer nicht geringen Zahl an Menschen berichtet. Wo aber sogar Experten für belastbare Grundlagen zunehmend im Trüben fischen, setzen Mythen sich umso stärker durch; erst recht, wenn die tägliche Informationsflut nicht gleichzeitig auch die Metaangaben vermittelt, die es braucht, um die Daten richtig einzuordnen. Kontrollierte Erfassung, wissenschaftliche Güte, Nachprüfbarkeit und Interpretationskompetenz gehören in Bezug auf Daten deshalb noch vor jedem Dashboard zum Handwerkszeug für den Umgang mit der Corona-Krise: Das gilt für Politiker und Journalisten genauso wie für die Bevölkerung.

Aufträge
spitzengram
Blog