Andreas Haupt learn, teach, decide

Daten, Corona-Hotspots und strukturelle Gewalt

Die COVID-19-Pandemie erforderte und erfordert koordinierte und starke Einschnitte in unsere Mobilität. Dabei rücken neben einzelnen Personen, die grossen Einfluss auf die Verbreitung einer Krankheit haben, auch Orte in den Blick, sogenannte “Hotspots”. Weitreichender Zugang zu Mobilitätsdaten ermöglicht es in Theorie, sehr genau die Effekte der Schliessung öffentlicher Orte zu bestimmen. Ich und meine Mitforschenden machen genau das. Trotz grosser ethischer Herausforderungen sehen wir Weisen, wie die Macht der Mobilitätsdaten für Gutes genutzt werden kann.

Hotspots schliessen statt Superspreader anprangern

Die Weitergabe von Infektionen an andere ist nicht gleichverteilt. Bilder der letzten Monate zeigen oft Menschen Betrunkene Spring-Breaker auf gefüllten Stränden, Menschen die eng gedrängt demonstrieren, Gotteshäuser mit singender Gemeinde von Gläubigen. Menschen, die viele solche Sozialkontakte als Erkrankte haben, und solche, die sich nicht an Regeln halten, sogenannte Superspreader, oder solche die es sein könnten, übernehmen in allen diesen Beispielen eine wichtige Rolle.

Bei der letzten weltweiten Pandemie, der Spanischen Grippe, die im Frühsommer 1918, am Ende des 1. Weltkriegs, Europa erreichte, war das Verständnis der Krankheit weit entfernt von einem Niveau, auf dem Superspreader hätten identifiziert werden können. Tageszeitungen umschrieben die Krankheit als “geheimnisvoll”, “rätselhaft” oder “unbekannt”. Massenveranstaltungen wurden nicht eingeschränkt. In der Endphase des Krieges waren auch Zeitungen als Kommunikations- und Dokumentations-Medium bis auf den kriegsrelevanten Teil zensiert.

Kölner Lokalanzeiger 30.05.2018, gemeinfrei

Mit dem neuen Begriff des Superspreaders wird Menschen jedoch oft Unrecht angetan. Denn Orte, an denen Menschen arbeiten und lieben, können ebenso eine wichtige Rolle spielen, wer zu Superspreadern wird, und dies ist oft nicht freiwillig. Die letzten Monate brachten Beispiele von Orten, wo zumindest zeitweise unfreiwillig Menschen auf grosser Enge zusammenkommen: Menschen auf Kreuzfahrtschiffen (Diamond Princess), Schlachter*innen in Schlachthöfen (Gütersloh), oder Stewards in Flügen – ob nun aus physischer Beschränkung oder ökonomischer Notwendigkeit. Hier sind es Orte vielmehr als Menschen, die zu Ansteckungen von Personen führen.

Und wer solche Orte frequentiert, ist nicht zufällig. Es sind ohnehin schon sozial schwächer gestellte, die öffentlichen Verkehrsmittel nutzen müssen, oder nicht von daheim arbeiten können. Viele Menschen die faktisch Superspreader sind, sind somit oft nicht nur Menschen, die gezwungen sind, gefährlichere Orte zu frequentieren, sondern häufig auch gefährdeter durch die Pandemie. Es ist daher gefährlich, Superspreader*innen abschätzig zu behandeln, ohne deren individuelle Situation zu betrachten.

Objektiver bewertet werden kann das Risiko von Orten der Zusammenkunft. Geschlossene Räume mit wenig Luftbewegung, deren gewöhnliche Nutzung Sprechen beinhaltet, sind nach derzeitigem Wissensstand Orte hohen Risikos, unabhängig von deren Nutzung, und potenzielle Infektions-Hotspots. Alle Menschen, die die dicht in solchen Orten zusammen kommen können, sollten sie infiziert sein, Superspreader sein.

Ein gutes Beispiel für die Wichtigkeit von Orten für Infektionen ist die New Yorkerin Mary Mallon, die Anfang des 20. Jahrhunderts über 50 Menschen mit Typhus infizierte. Sie arbeitete als Köchin, war Trägerin der Krankheit, zeigte aber keine Symptome. Sie pflegte Menschen die sie infizierte, meist an ihren verschiedenen Arbeitsstätten, und gab dabei die Krankheit selbst weiter. Mrs. Mallons Infektionsrisiko wurde durch Orte und ihre ökonomische Situation beeinflusst, mehr noch als durch persönlichen Entscheidungen.

Daher sind Kapazitätsbegrenzungen und Schliessungen von Orten hohen Risikos einige der Reaktionen auf COVID-19 gewesen. Potenzielle Hotspots waren in diesem Frühjahr und Frühsommer länger geschlossen, etwa Restaurants, Bars, und Kirchen. Solche Beschränkungen ermöglichen auch, dass Einzelne sich weniger Gedanken darüber machen müssen, wie sie ihr Verhalten anpassen. Sie müssen etwa nicht entscheiden eine Einladung etwa in die Kirche auszuschlagen, keine Gemeinschaft ablehnen, um Gemeinschaft auf andere Weise zu erhalten. Schliessungen und Kapazitätsbeschränken machen es einfacher für Menschen, keine Superspreader zu werden, selbst, wenn sie nicht durch ihre physische oder ökonomische Situation dazu gezwungen werden.

Schriftwerk zu Typhoid Mary, gemeinfrei

Datengetrieben Schliessungen entscheiden

Dies legt nahe, besonders gefährliche Orte zu schliessen – und das ist mit existierenden Daten auch sehr gut möglich.

In einem derzeit laufenden Projekt mit Forschenden am MIT Media Lab nutzen wir Daten, um informierter die Risiken von Orten einzuschätzen.

Hier ist erst einmal zu bemerken, wie erstaunlich reich an Daten wir sind. Für jeden der etwa 40.000 Postleitzahlen der Vereinigten Staaten bietet die Firma Safegraph wöchentliche Besuchszahlen zu etwa 6 Millionen Interessenpunkten (welche etwa Supermärkte, aber auch Kirchen sind). Safegraph erhält diese Daten von verschiedenen Smartphone-Apps, aggregiert und de-anonymisiert sie. Die Nutzungs- und Besitzrechte an diesen Daten steht in einem anderen Kapitel, welches wir hier nicht aufschlagen.

Aber bei Mobilitäts-Daten hört es nicht auf. Es ist auch möglich, die Anzahl der Personen an einem Ort pro Stunde und die Grundfläche von Gebäuden existieren auch, und ermöglicht so, die Ansteckungswahrscheinlichkeit zwei zufälliger Personen an einem Ort abzuschätzen. Ebenso existieren durchschnittliche Kreditkartenabrechnung, was etwa die wirtschaftliche Aktivität eines Ortes abbildet. (In Amerika besitzt ein Grossteil aller Menschen eine Kreditkarte.) Andere Studien haben repräsentativ erhoben, welchen Typ von Einrichtung sie präferieren würden gegenüber anderen, wenn nur ein Typ offen bleiben kann (Beispielfrage: “Würden Sie lieber Kirchen oder Tabakläden geöffnet sehen?”). Das ermöglicht, über Ansteckungswahrscheinlichkeit und wirtschaftlicher Bedeutung auch einzuschätzen, für wie essentiell Orte gehalten werden. Und auch die Reaktion von Schliessungen kann mit Daten verstanden werden. Mit Daten aus Vor-Corona-Zeiten kann eine Vermutung angestellt werden, wie wahrscheinlich ist es, dass Menschen zu einer weiter entfernten Eisdiele fahren, wenn eine nähere schliesst, und wie wahrscheinlich ist es, dass sie Besuche nicht durchführen.

Data Scientists mit sehr grossem Selbstbewusstsein können mit diesen Daten ein grosses Optimierungsproblem dafür aufschreiben, welche Orte offen, welche geschlossen bleiben sollten. Dass die Daten reich genug sind, auch Verhalten von Menschen im Fall von Schliessungen abzuschätzen, ermöglicht nicht nur grosse und gut aufgelöste, sondern auch authentische Modelle zu schreiben.

Mobilitätsgraph, PNAS, 2009

Ein solches Modell, oder immerhin eine Risikoeinschätzung, die auch die Reaktion von Menschen mit einschliesst, stellen meine Kolleg*innen und ich auf.

Optimierung am ethischen Pranger

Viele ethische Herausforderungen werden in solch einem Modell intransparent. Nicht nur kann ein solcher Optimierungs-Ansatz gesellschaftliche Zersplitterung verschärfen und Schliessentscheidungen, die vermutlich nicht gewünscht sind, hervorrufen, er kann dies auch sehr intransparent tun. Bevor ich unsere Forschung versuche zu retten, hier eine Trias ethischer Probleme, die beim Optimieren mit grossen Daten entstehen.

Das Modell kann implizit Segregation verschärfen. Es ist, zum Beispiel, sehr natürlich, dass Menschen mehrere Interessenpunkte während einer COVID-Inkubationszeit besuchen. Falls dies der Fall ist, können sie sich bei einem ersten Besuch anstecken, und den Virus bei einem zweiten weitergeben. Um eine Virus-Ausbreitung zu verhindern, wäre es tendenziell optimal, Interessenpunkte, die Stadtteile verbinden (etwa in der Nähe von Brücken) zu schliessen, damit Menschen weniger Anreize haben, sich in einem anderen Stadtteil als ihrem Wohn-Stadtteil zu bewegen. Das klingt nach einer Quarantäne ganzer Stadtteile, durch Mobilitäts-Nudges durchgesetzt, die, kombiniert mit unterschiedlicher medizinischer Ausstattung und unterschiedlicher gesundheitlicher Verfassung der Bevölkerung, ungleiche Überlebenschancen nach Stadtteil hervorruft. Die Frage muss sein: Wie sind die negativen Effekte der Schliessungsregelung verteilt? Sind die Personen, die ohnehin schon schlecht dastehen, mehr getroffen als andere?

Weiterhin kann dieses keine kompakten Rechtfertigungen für Schliessentscheidungen geben. Nehmen wir an, dass das Modell berechnet, ein bestimmter Interessenpunkt müsste optimalerweise geschlossen werden. In diesem Fall könnte eine betroffene Person, etwa eine, die durch eine Gehbeeinträchtigung nicht weit zu einem Supermarkt laufen kann, keine gute Erklärung für das Warum dieser Entscheidung bekommen. Dadurch, dass das Modell versucht menschliches Verhalten abzubilden, sind seine Entscheidungen kompliziert, kryptisch. Es könnte antworten, dass das Risiko dieses Supermarkts zu hoch ist gegeben das Level an Essentialität, wie bestimt durch Konsultation der Bevölkerung. Ob das die betroffene Person mit dem Prozess zufriedenstellt, ist fraglich. Wir müssen uns also auch fragen: Ist der Prozess, wie entschieden wird, so, dass Menschen mit ihm interagieren können, und einen Einfluss auf den Ausgang für sie haben?

Schliesslich ist es in einem solchen Modell allzu verlockend, bestimmte Wertkonflikte direkt in das mathematische Modelle zu schreiben, anstatt sie zu reflektieren. Da die Daten zu Kreditkartentransaktionen vorhanden sind, könnte man etwa (nicht ganz ungeschickt), über Stadtteile hinweg das Durchschnittseinkommen mitteln, und dann die Transaktionen im Stadtteil gegeben dieses Durchschnittseinkommen normalizieren. Was dieses Modell nicht klar macht, ist dass Menschen mit selbst dem gleichen Einkommen, und dem gleichen Mobilitätsverhalten, unterschiedliches Gewicht je nach ihrem Wohnort erhalten. Es ist nicht einfach zu sehen, wann ein Optimierungsproblem solche unerwünschten Nebeneffekte ausschliesst. Wir müssen uns also auch Fragen: Wissen wir gut genug, was wir wollen, und können wir dass im Modell abbilden?

Die Rechtfertigung von Big Data

Die drei Gründe wiegen schwer, hier eine Verteidigung der datengetriebenen Forschung von COVID-Schliessungen.

Erstens ist es wichtig, Menschen klarzumachen, dass der Besuch von mehreren Orten innerhalb einer Inkubationszeit, und damit die Möglichkeiten, sich einmal anzustecken, und die Krankheit bei einem nächsten Besuch weiter zu geben, eine echte Möglichkeit ist. Das könnte dann beeinflussen, wie das Risiko von Orten eingeschätzt wird. Politikmachende brauchen eine Einschätzung wie relevant diese Effekte sind, um Entscheidungen auf ihrer Basis zu treffen. Aber auch einzelne sollten sehen, dass etwa die Gefahren von Flugzeugen nicht nur daher kommt, dass diese Menschen auf engem Raum zusammen bringt. Wichtig ist auch, dass Flugzeuge Menschen aus allen möglichen Orten mischen, und Menschen aus einem Ort mit geringer COVID-Prävalenz sich nun dem einer durchschnittlichen Gruppe Flugreisender ausgesetzt sehen. Das kann zum einen den Umgang mit dem Ort entspannen, zum anderen aber auch die Interaktion mit Menschen beeinflussen. In dieser Weise kann datengetriebene Forschung helfen, die Denkweisen von Menschen zu beeinflussen. Dieser Artikel ist bereits ein Teil hiervon.

Zweitens ist datengetriebene Forschung aber auch wichtig, um pragmatische Entscheidungen zu rechtfertigen. Wenn es sich in den Daten zeigt, dass viele Raucher*innen sich keine Zigaretten nach Hause liefern lassen, wenn der nächste Zigarettenladen schliesst, sondern relativ beliebig weit fahren, dann macht es vermutlich wenig Sinn, diese Läden zu schliessen, denn eine Schliessung führt nur zu einer grösseren Auslastung weiter entfernter Zigarettenläden, und einer heterogeneren Besucher*innenschaft. Wenn Daten tatsächlich zeigen, dass Raucher*innen weit fahren für ihren Zigarettenkauf, kann also das Offenbleiben von Zigarettengeschäften gerechtfertigt werden, selbst aus einer COVID-Risiko-Einschätzung.

Schliesslich kann Arbeit mit Daten, die über ein ganzes Land gehen, lokalen Entscheidungsträgern die Besonderheiten der Umgebung transparent machen. Zusammenstellungen für die Massnahmen verschiedener Staaten ermöglichen Entscheidungsträger*innen ihre Regelungen zu koordinieren. Forschung, die lokalen Authoritäten eine klare Idee über Besuchsmuster von Orten gibt, kann ermöglichen, Regelungen lokal anzupassen. Evidenz, die wir liefern, kann eine lokale Diskussion auf eine Grundlage stellen, und entlastet so die Entscheidungsträger in ihrem Entscheidungsdruck, etwa beim Schliessen wichtiger Orte wirtschaftlicher Aktivität.

Wir brauchen ein gutes Verständnis menschlichen Verhaltens, um wirklich riskante Orte zu schliessen. Daten ermöglichen uns das, und bringen uns Macht, und auch Verantwortung. Die Entscheidung muss aber weiter dort liegen, wo das Wissen um lokale Besonderheiten ist: vor Ort.