Quantenverbesserte Repräsentationen erhöhen die Leistung klassischer ML-Modelle in verschiedenen Domänen

03.06.2026
Mittlerer absoluter Fehler der Validierung für das klassische DimeNet++-Modell im Vergleich zum quantenverstärkten QDimeNet++-Modell, das in dieser Arbeit vorgeschlagen wird. Michael Binder
Mittlerer absoluter Fehler der Validierung für das klassische DimeNet++-Modell im Vergleich zum quantenverstärkten QDimeNet++-Modell, das in dieser Arbeit vorgeschlagen wird.

Forschende am Institut für Experimentelle Teilchenphysik (ETP) und am Institut für Theoretische Physik (ITP) des KIT haben in Zusammenarbeit mit dem Imperial College London eine neue Methode entwickelt, die Ideen aus dem Quantencomputing nutzt, um große Modelle des maschinellen Lernens leistungsfähiger zu machen, ohne dass dafür ein tatsächlicher Quantencomputer benötigt wird. Die Methode mit dem Namen QUIVER gibt Modellen des maschinellen Lernens (ML) eine „quantenverbesserte Sicht“ auf die Daten, die sie verstehen sollen, und hilft ihnen dadurch, Muster zu erkennen, die ihnen andernfalls entgehen würden.

Die Idee funktioniert folgendermaßen: Wenn ein großes ML-Modell etwas Komplexes betrachtet, etwa einen Teilchenschauer, der im Large Hadron Collider (LHC) erzeugt wurde, oder die Struktur eines Moleküls, sieht es gewöhnlich nur eine flache Liste von Zahlen, die das Objekt beschreibt. Das zugrunde liegende Prinzip von QUIVER ist einfach: Dieselbe Eingabe wird durch einen variationalen Quantenschaltkreis geleitet, der wie eine andere Art von Linse wirkt. Diese Linse hebt hervor, wie verschiedene Teile der Eingabe miteinander verbunden sind, also Korrelationen, die in gewöhnlichen Zahlentabellen schwer zu erkennen sein könnten. Das Ergebnis ist eine kompakte Zusammenfassung dieser verborgenen Zusammenhänge, die das ML-Modell anschließend zusätzlich zu seiner normalen Eingabe nutzen kann.

Die Forschenden testeten die Methode an zwei sehr unterschiedlichen Problemen und demonstrierten damit ihren domänenunabhängigen Charakter. Beim ersten ging es darum, den Ursprung von Teilchenjets am LHC zu identifizieren, eine Aufgabe, die für nahezu jede Analyse am CERN wesentlich ist. Beim zweiten ging es um die Vorhersage einer wichtigen Eigenschaft kleiner Moleküle: der Energielücke zwischen dem höchsten besetzten und dem niedrigsten unbesetzten Molekülorbital. In beiden Fällen machte das Hinzufügen der quantenverbesserten Repräsentation zu bestehenden State-of-the-Art-Modellen diese messbar genauer, während ihre Größe kaum zunahm. Die Verbesserungen waren über viele Trainingsläufe hinweg konsistent, was darauf hindeutet, dass die Quantensicht tatsächlich neue Information bereitstellt und nicht lediglich als zusätzliche Erweiterung der Eingabe wirkt.

Die Ergebnisse sind als Preprint auf arXiv verfügbar, und eine kurze Zusammenfassung ist auf der Projektseite abrufbar. Sie werden auf der International Conference on Machine Learning (ICML) 2026 im AI4Physics-Workshop vorgestellt, der im Juli in Seoul, Südkorea, stattfinden wird, und durchlaufen nun ein zusätzliches Peer-Review-Verfahren für die Veröffentlichung in einer Fachzeitschrift. Die Forschung wurde von Masterstudent Michael Binder und Postdoc Dr. Aritra Bal durchgeführt.

Kontakt: Dr. Aritra Bal