Verfolgt vom eigenen Datenschatten

Wenn aus großen Datensammlungen Risikoprognosen abgeleitet werden, endet die Selbstbestimmung

Kaum jemand hinterlässt keine Datenspuren. Daraus lassen sich hilfreiche Forschungsergebnisse gewinnen, sagen Wissenschaftler. Mit der Verletzung von Datensicherheit wird Geld verdient, sagen Kritiker.

Wer käme auf die Idee, von der Farbe eines Gebrauchtwagens auf dessen technischen Zustand zu schließen? Durch Big-Data-Techniken werden ungeahnte Zusammenhänge sichtbar. Durch Internet und mobile Geräte fallen immer größere Datenmengen an, die neue Möglichkeiten der Auswertung schaffen.

In der Medizin können Big-Data-Analysen Leben retten. Für Frühgeborene stellen Infektionen ein großes Risiko dar. Ist eine Infektion erst einmal ausgebrochen, beginnt der Kampf ums Überleben. Umso wichtiger ist es daher, Infektionen zu erkennen, bevor sie ausbrechen. Kanadische Wissenschaftler haben durch umfangreiche Messungen von Vitalfunktionen bei Frühgeborenen große Datenmengen gesammelt. Darin konnten sie Muster entdecken, aus denen bevorstehende Infektionen ablesbar werden. Eine Behandlung kann dadurch 24 Stunden, bevor erste Symptome auftreten, beginnen. Andere Projekte setzen die Verknüpfung und Auswertung von Daten in der Bekämpfung von Malaria und Polio ein.

»Daten sprechen lassen« nennt das Viktor Mayer-Schönberger. Der Österreicher kennt viele solcher Fälle. Er hat zusammen mit dem Datenexperten des »Economist«, Kenneth Cukier, ein Buch dazu geschrieben: »Big Data - Die Revolution, die unser Leben verändern wird.« Die genannten Beispiele zeigten allerdings, dass man durch Big Data nur erfährt, was passiert, aber nicht, warum etwas passiere, gibt Mayer-Schönberger zu bedenken. »Diese Algorithmen messen Korrelationen; echte Kausalitäten lassen sich kaum messen«, fügte der Professor der Universität Oxford bei einem Vortrag in Berlin hinzu.

Bisher haben sich Wissenschaftler und Meinungsforscher auf die kleinstmögliche Datenmenge beschränkt. Denn in der alten »Small-Data-Welt« sei das Sammeln und Analysieren von Daten kostspielig gewesen, so Mayer-Schönberger. Das habe zur Bedeutung der Stichprobe geführt. Er beschreibt die bisherige Methode so: »Aus wenigen Daten viel herausholen«. Doch sinkende Speicherkosten haben das geändert. Zwischen 1987 und 2007 habe sich das Datenvolumen verhundertfacht. Beispielsweise verarbeite Google ein Petabyte Daten pro Tag, berichtet der Wissenschaftler. Laut dem Marktforschungsunternehmen IDC wird sich die weltweite Datenmenge bis 2020 erneut verzehnfachen. Große Mengen erlauben Unschärfe: »Mit Big Data ist Genauigkeit weniger wichtig«, sagt Mayer-Schönberger. Ein dummer Algorithmus mit einer Riesenmenge Daten liefere ein besseres Ergebnis, als ein schlauer Algorithmus mit einem geringen Datenvolumen. Bisher hätten Forscher zuerst eine Fragestellung entwickeln müssen und dann angefangen, Daten zu sammeln. Heute laute die Devise: Erst sammeln, dann fragen. Er sieht darin einen Paradigmenwechsel. Den neuen Möglichkeiten stehen vielfältige Gefahren gegenüber, Mayer-Schönberger warnt vor einer »Diktatur der Daten«. Die läge vor, wenn Menschen aufgrund von Prognosen keine Versicherung erhielten oder sogar verhaftet würden.

Verschiedene US-Bundesstaaten setzten bereits Big Data zur Verbrechensbekämpfung ein. »Es wird eine Großdatenanalyse gemacht, um herauszufinden, ob jemand auf Bewährung freigelassen werden soll«, berichtet er. Man wolle herausfinden, wie hoch die Rückfallgefahr sei. Er warnt davor, aus solchen Datenanalysen Konsequenzen zu ziehen, denn »das wäre eine Strafe ohne echten Beweis«. Deshalb fordert Mayer-Schönberger Rahmenbedingungen, damit »wir Big Data kontrollieren und nicht Big Data uns kontrolliert«.

Der ehemalige Bundesdatenschutzbeauftragte Peter Schaar weist darauf hin, dass die Möglichkeiten zur Datenauswertung ungleich verteilt sind: Nicht jeder sei gleichermaßen in der Lage, aus Datensammlungen Erkenntnisse zu gewinnen, sondern lediglich große Internet-Konzerne. »Wir müssen uns fragen: Wo bleibt da unsere Selbstbestimmung?«

Die Auswertung großer Datensammlungen soll Unternehmen mehr Nähe zum Kunden bringen. Sie wollen dem Kunden ungefragt direkt über die Schulter schauen. Aber will der das? Beispiele für Big-Data-Ergebnisse zum Vorteil des Kunden sind selten. Ein solches könnte der Kauf eines Gebrauchtwagens bilden. Die Big-Data-Analyse empfiehlt Autos in der Farbe Orange, denn die kämen laut Mayer-Schönberger in den Unfallstatistiken am besten weg. Jedoch sollte man dabei die Warnung des Wissenschaftlers vor falschen Schlussfolgerungen nicht vergessen: Ein unfallfreies Fahrzeug muss keineswegs in gutem technischen Zustand sein.

nd Journalismus von links lebt vom Engagement seiner Leser*innen

Wir haben uns angesichts der Erfahrungen der Corona-Pandemie entschieden, unseren Journalismus auf unserer Webseite dauerhaft frei zugänglich und damit für jede*n Interessierte*n verfügbar zu machen.

Wie bei unseren Print- und epaper-Ausgaben steckt in jedem veröffentlichten Artikel unsere Arbeit als Autor*in, Redakteur*in, Techniker*in oder Verlagsmitarbeiter*in. Sie macht diesen Journalismus erst möglich.

Jetzt mit wenigen Klicks freiwillig unterstützen!

Unterstützen über:
  • PayPal
  • Sofortüberweisung