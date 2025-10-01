Das »Square Kilometre Array« – ein Netzwerk zahlreicher Teleskope Foto: AFP

Ob am Kernforschungszentrum Cern viele Millionen Teilchen pro Sekunde kollidieren, im Weltraum Schwarze Löcher Materie ansammeln oder Sterne explodieren – die Physik kann mit Detektoren zunächst jede Menge Daten sammeln. Begeisterten Wissenschaftlern geht es dann wie Kunden nach dem großen Wochenendeinkauf: Die (Daten-)Schätze sollen nicht nur möglichst schnell ihren Bestimmungsort erreichen – sie müssen dort auch gut sortiert und anschließend sicher aufbewahrt werden.

Zunehmend komplexer werdende wissenschaftliche Fragestellungen können, insbesondere in der Physik und Astrophysik, oft nur noch durch internationale Großforschungsprojekte bearbeitet werden. Die Forschungseinrichtungen produzieren dabei immer mehr und schneller gewaltige Datenmengen, die automatisch verarbeitet werden müssen, damit Wissenschaftler weltweit sie analysieren können.

Ein Petabyte Daten pro Tag

Das europäische Kernforschungszentrum Cern betreibt etwa mit dem weltweit größten und leistungsstärksten Teilchenbeschleuniger Large Hadron Collier (LHC) Grundlagenforschung auf dem Gebiet der Kernphysik. Fast auf Lichtgeschwindigkeit beschleunigte Teilchen kollidieren in dem knapp 27 Kilometer langen Ringtunnel und erzeugen dabei extrem hohe Temperaturen und Dichten, die es erlauben, die grundlegende Natur der Materie zu untersuchen.

Bei bis zu einer Milliarde Kollisionen pro Sekunde brauchen die Detektoren etwas »Hilfe«: Eine Art Ereignisfilter führt besonders aussichtsreiche Ereignisse der weiteren Datenverarbeitung zu. Doch auch nach dem Aussieben hat das Cern Data Centre noch genug zu tun: Durchschnittlich ein Petabyte an Daten pro Tag will gepflegt werden. Das entspricht ungefähr der Datenmenge, die auf 1000 handelsüblichen Festplatten mit einer Kapazität von einem Terabyte gespeichert werden kann.

Zur Verarbeitung der Daten dient das LHC Computing Grid, ein System für verteiltes Rechnen (eine Art Zusammenschluss unabhängiger Rechner), das am Cern entwickelt wurde. Anschließend geht es ins Datenarchiv: Im September 2023 überschritt das Datenspeichersystem des Cern die Größe von einem Exabyte (eine Million Terabyte), verteilt auf 111 000 Speichermedien. Hinzu kommen weitere 1000 Petabyte im weltweiten Rechennetz, auf das Forscher internationaler Kooperationen zur Auswertung und Analyse von Daten zugreifen können.

Datentransport per Festplatte

Das Event Horizon Telescope (EHT; Ereignishorizontteleskop) ist ein weltweiter Zusammenschluss von Radioteleskopen, die mittels Interferometrie supermassereiche Schwarze Löcher mit hoher Winkelauflösung untersuchen. Die aufgezeichneten Messreihen sind so umfangreich, dass sie nicht mehr per Internet versandt werden können: Sie werden auf Festplatten gespeichert und anschließend »zu Fuß« zu ihrem Bestimmungsort gebracht. Das augenzwinkernd auch »Turnschuhnetzwerk« (engl. Sneakernet) genannte Verfahren wurde nicht nur beim Transport von 120 Terabyte Daten des Hubble-Weltraumteleskops in ein Rechenzentrum erfolgreich angewandt, sondern eben auch bei der Erstellung des ersten Abbilds eines Schwarzen Lochs. Rund 450 Kilogramm Festplatten nahmen die fünf Petabyte Daten des EHT auf, die für die Auswertung per Lastwagen und Flugzeug zu den Rechenzentren gebracht wurden. Monatelange Analysen mit komplexen Algorithmen zur Daten- und Bildverarbeitung lieferten im April 2019 dann »das Foto« des Schwarzen Lochs oder genauer: die gravitativ verzerrten, aufgeheizten Materieflüsse, die vom Schwarzen Loch in der Galaxie Messier 87 aufgesammelt werden.

Ein Glasfasernetz für die Forschung

Das derzeit im Bau befindliche Square Kilometre Array (SKA), ein Radioteleskop-Netzwerk mit weltweit verteilten Antennen, zielt nicht nur auf einen weiten Blick ins All, sondern benötigt schon jetzt erheblichen Weitblick in Bezug auf die Datenverarbeitung: Wenn das SKA in einigen Jahren seinen Betrieb aufnimmt, werden bis zu 600 Petabyte Daten pro Jahr erwartet. Diese sollen in regionalen Rechenzentren verarbeitet werden; eines der größten wird derzeit in Kanada aufgebaut. Das Land verfügt schon heute über das eigens für die Forschung installierte 19 000 Kilometer lange Glasfaser-Kommunikationsnetzwerk »Canarie«, das an Forschungsinstitute weltweit angeschlossen ist und ebenfalls Teil der Datenmanagement-Infrastruktur werden soll. Und dann können die astronomischen Daten in astronomischen Mengen wirklich kommen.