Reinforcement Learning, Steuerung und Optimierung – Von der Vorhersage zur Entscheidung
Was uns antreibt
Der Großteil der maschinellen Lernverfahren – einschließlich Deep Learning und probabilistischer Modelle – ist auf Vorhersagen ausgerichtet. Doch in vielen Anwendungen genügt das nicht: Unser Ziel ist nicht bloß zu wissen, wie sich ein System verhält, sondern es aktiv zu steuern – vom Auto über die Produktionslinie bis zum Roboter.
Solche entscheidungsbasierten Aufgaben sind das Einsatzfeld von Reinforcement Learning (RL), Optimierungsmethoden und intelligenter Regelungstechnik .
Unser Ansatz
Wir entwickeln neue Methoden im Reinforcement Learning und in der Optimierung , die auf die Dateneffizienz von Lernversuchen ausgelegt sind. Ziel ist es, optimale Steuerungsstrategien mit möglichst wenigen realen Versuchen zu erlernen.
- Für nicht-sequentielle Aufgaben nutzen wir fortschrittliche Verfahren der Bayesschen Optimierung .
- Für sequentielle Aufgaben – etwa Steuerungsprobleme – entwickeln wir Batch-Reinforcement-Learning-Methoden, die bestehende Daten wiederverwenden und so den Lernprozess deutlich beschleunigen.
In der Robotik verknüpfen wir visuelle Wahrnehmung und Manipulation , indem wir Deep Learning und klassische Regelung miteinander kombinieren – für adaptive, leistungsfähige Steuerungssysteme.
Anwendungsfelder
Unsere Methoden kommen überall dort zum Einsatz, wo Entscheidungen datenbasiert getroffen oder Systeme über geschlossene Regelkreise gesteuert werden müssen – z. B. in der Robotik, in der Fertigung oder in der Fahrzeugtechnik.