Zum Hauptinhalt springen
Unsere Forschungsexpertinnen und -experten

Jonathan Francis, Ph.D.

Lead Research Scientist, Robot Learning und Multimodal Machine-Learning

Unsere Wahrnehmungen der Realität werden durch die Rückschlüsse geprägt, die wir ziehen, sodass neue Denkweisen unsere Sicht der Realität effektiv verändern können.

Hans Moravec
Forschungsexperte Jonathan Francis vor Sonnenuntergang in der Stadt.

Ich bin Lead Research Scientist bei Bosch Research in Pittsburgh, Courtesy Faculty am Robotics Institute der Carnegie Mellon University (CMU) und Area Expert für Robotik am Carnegie Bosch Institute der CMU. Zudem bin ich Technischer Leiter für das Robotiklabor in Pittsburgh. Meine Forschung verbindet Multimodal Machine Learning und Robot Learning: Ich ermögliche es z.B. Robotern, robuste Fähigkeitsrepräsentationen zu lernen – für Cross Embodiment Transfer, generalistische Verhaltensweisen und fehlerbehebendes Reasoning.

Diese Arbeit befasst sich mit wesentlichen Lücken, die bisher die Einsatzfähigkeit fortschrittlicher autonomer Technologien in Produktionssystemen von Bosch eingeschränkt haben. Mit zahlreichen Publikationen und organisierten Workshop-Veranstaltungen sowie Herausforderungen jedes Jahr bleibe ich in der Robotik- und KI/ML-Wissenschaftsgemeinde aktiv. Ich bin häufig im TPC oder als Area Chair, Editor, Associate Editor oder Scientific-Advisory-Board-Mitglied für verschiedene Konferenzen und Fachpublikationen tätig. Bei Bosch Research leite ich Projekte zur Ausbildung von Vision Language Action Modellen für geschickte robotische Manipulation und zur Integration humanoider Roboter in Produktionsumgebungen. Ich bin auch für etliche institutionsübergreifende Kooperationen, Beratungen für Doktorandinnen und Doktoranden sowie Nachwuchswissenschaftlerinnen und -wissenschaftler sowie für öffentlich geförderte Projekte zuständig.

Was fasziniert Sie an der Forschung am meisten?
Die Forschung ermöglicht es uns, neue Möglichkeiten zu erschließen, das Wissen der Menschheit ständig weiterzuentwickeln und Probleme zu lösen, die bisher als unlösbar galten. Als Wissenschaftler in der Industrieforschung geht es darum, eine der Wissenschaft gewidmete Karriere mit der Möglichkeit (und Verantwortung) zu verbinden, modernste Technologien einzusetzen, damit neue Effizienzen und Fähigkeiten hinsichtlich Unternehmensprodukte, -dienstleistungen und -herstellungsprozesse ermöglicht werden können. Tatsächlich schätze ich ganz besonders die Chance, theoretische Durchbrüche in ML, KI und Robotik mit praktischen Anwendungen zu verknüpfen. Im Zeitalter vielseitiger Welt- und Handlungsmodelle mit großen Kapazitäten ist es zunehmend möglich geworden, autonome Systeme zu entwickeln, die über ihre Umgebung nachdenken, von Demonstrationen lernen, ihren eigenen Fortschritt in Richtung eines Ziels überwachen und Korrekturmaßnahmen ergreifen, um ihr eigenes suboptimales Verhalten zu korrigieren. Der Forschungsweg ist sicherlich nichts für schwache Nerven, aber mich treibt die Aussicht voran, gleichzeitig zur Entwicklung und Anwendung dieser Technologien beizutragen.

Was ist das Besondere an der Forschung bei Bosch?
Bosch Research zeichnet sich dadurch aus, dass der Bereich in den praktischen Bedürfnissen der Industrie verwurzelt ist und gleichzeitig wissenschaftliche Spitzenforschung fördert. Bosch verfügt über ein unglaublich vielfältiges Portfolio an Forschungsthemen mit einer großen multikulturellen und multinationalen Bandbreite. Die Zusammenarbeit zwischen Bosch Research Pittsburgh und angesehenen akademischen Einrichtungen wie der Carnegie Mellon University fördert einen dynamischen Austausch von Ideen und ermöglicht so die Umsetzung komplexer Forschungsergebnisse in praktikable Lösungen. Darüber hinaus sorgt der Fokus von Bosch auf Nachhaltigkeit, Effizienz und Zuverlässigkeit dafür, dass unsere Forschung nicht nur die Technologie vorantreibt, sondern sich auch an breiter angelegten gesellschaftlichen Zielen orientiert.

An welchen Forschungsthemen arbeiten Sie derzeit bei Bosch?
Meine Arbeit zielt auf Verbesserungen bei der Intelligenz und Anpassungsfähigkeit autonomer Systeme ab, die in unterschiedlichen Umgebungen eingesetzt werden. Meine aktuelle Forschung konzentriert sich auf fortschrittliche Robotik, die mit multimodalen/multisensorischen Foundation Models ausgestattet ist. Auf der Modellierungsseite untersuche ich die folgenden Lernparadigmen: (i) das Abrufen von Robotertrajektorien zur Erweiterung des Lernens von Testzeit-Verfahren zur Verbesserung der (Wieder-)Verwendung von Daten; (ii) die Online-Generalisierung und -Anpassung von Roboterverfahren durch die Anleitung von Agentic Frameworks (z. B. Chain-of-Thought-Reasoning bzw. Gedankenkettenführung, Lernen im Kontext und Codegenerierung); (iii) multimodales/multisensorisches Repräsentationslernen mit z. B. visuellen/vibro-taktilen Signalen für ein verbessertes Verständnis der Objektkontaktphysik, der Objektbezüge und der Objektoberflächeneigenschaften in Tabletop- und mobilen Bedienungseinstellungen; und (iv) darstellungsübergreifendes Transfer-Lernen zur Skalierung von Methoden in verschiedenen Roboterplattformen. Auf der Anwendungsseite betrachten wir die Fabrikautomatisierung, wie z. B. die ausgeklügelte Tabletop-Bedienung für die Montage sowie mobile Bedienungsaufgaben wie das Abrufen/Rückholen von Bauteilen, den Werkzeugtransport und die Maschinenpflege. Wir schlagen vor, alle oben genannten Funktionen in „Toolkits“ für KI/Robotik-Geschicklichkeit zu kombinieren, damit Linienmanager in die Lage versetzt werden, einige komplexe Aufgaben umgehend zu automatisieren. Schließlich bewerten und erleichtern wir den Einsatz humanoider Roboter für Fabrikautomatisierungsaufgaben.

Was sind die größten wissenschaftlichen Herausforderungen auf ihrem Forschungsgebiet?
Trotz aller bemerkenswerten Fortschritte gibt es beim Robot Learning und Multimodal Machine-Learning noch einige Hürden zu überwinden:

1. Dateneffizienz: Die Verringerung der Abhängigkeit von großen Mengen gelabelter Daten für das Training robuster Modelle bleibt eine entscheidende Herausforderung, die die Entwicklung effizienterer Lerntechniken erfordert. Systeme in die Lage zu versetzen, die Fülle der vorhandenen menschlichen Darstellungen zu nutzen (z. B. YouTube), stellt das Erlernen effektiver gemeinsamer Darstellungen vor große Herausforderungen. Siehe Memmel et al., 2025; Yoo et al., 2025; Niu et al., 2025 usw.

2. Multimodale Fusion: Die Vereinheitlichung von Konzepten aus unterschiedlichen Sensormodalitäten bleibt ein offenes Thema im Bereich KI und Robotik. Jede Modalität hat ihr eigenes Geräuschverhalten und ihre eigenen Datenformate, und es ist schwierig, sie in effizienten Token- oder Konzeptdarstellungen so zu kombinieren, dass sie domänenübergreifend generalisiert werden können und Robustheit in Robotiksystemen ermöglichen. Siehe Tatiya et al., 2022, 2024.

3. Domainübergreifende Generalisierung: Um sicherzustellen, dass fortschrittliche Lerntechniken zuverlässig im großen Maßstab funktionieren, braucht man Erfahrung im Umgang mit verschiedenen Roboter-Hardwareplattformen in verschiedenen Umgebungen, mit unterschiedlichen Aufgaben und mit verschiedenen Objekten und Arbeitsbereichskonfigurationen. Auch wenn es verlockend sein mag, Strategien in der Simulation zu trainieren, bevor man sie in realen Umgebungen einsetzt, müssen sich Modelle dennoch mit der Verteilungsverschiebung zwischen synthetischen Daten und realen Beobachtungen (Sim-to-Real-Lücke) auseinandersetzen, was einem zuverlässigen Einsatz oft im Wege steht. Siehe: Niu et al., 2025; Huang et al., 2023; Tatiya et al., 2022, 2024.

4. Sicherheit, Robustheit und Zuverlässigkeit: Von algorithmischer Transparenz bis hin zu zuverlässiger Ausfallsicherung ist es entscheidend, Vertrauen in autonome Systeme in anspruchsvollen Industrieumgebungen aufzubauen. Siehe Qadri et al., 2025; Bucker et al., 2024 usw.

Wie werden Ihre Forschungsergebnisse Teil der „Invented for life“-Lösungen?
Vorhandensein reichhaltiger multisensorischer Darstellungen der Welt sind für autonome Systeme unerlässlich, um fundierte Entscheidungen zu treffen, sichere Handlungen durchzuführen, sich an veränderte Umweltbedingungen anzupassen und effizient mit Menschen und anderen Akteuren interagieren zu können.

Lebenslauf

Seit 2026
Lead Research Scientist, Bosch Research Pittsburgh

Seit 2025
Courtesy Faculty, Robotics Institute, Carnegie Mellon University

Seit 2024
Area Expert für Robotik, Carnegie Bosch Institute, Carnegie Mellon University

2022 bis 2026
Senior Research Scientist, Bosch Research Pittsburgh

2022 bis 2025
Sponsored Scientist, Robotics Institute, Carnegie Mellon University

2017 bis 2022
Ph.D. Student/Kandidat, Robotik + Sprachtechnologien, School of Computer Science, Carnegie Mellon University

2014 bis 2022
Research Scientist I/II, Bosch Research Pittsburgh

Forschungsexperte Jonathan Francis in einem Labor.

Ausgewählte Publikationen

Publikationen

Liu et al., 2025

MOSAIC: Generating Consistent, Privacy-Preserving Scenes from Multiple Depth Views in Multi-Room Environments
  • Zhixuan Liu, Haokun Zhu, Rui Chen, Jonathan Francis, Soonmin Hwang, Ji Zhang, Jean Oh
  • International Conference on Computer Vision (ICCV 2025)
Publikationen

Yoo et al., 2025

KineSoft: Learning Proprioceptive Manipulation Policies with Soft Robot Hands
  • Uksang Yoo, Jonathan Francis, Jean Oh, Jeffrey Ichnowski
  • 9th Conference on Robot Learning (CoRL 2025) [Oral]
Publikationen

Saxena et al., 2024

GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering
  • Saumya Saxena, Blake Buchanan, Chris Paxton, Bingqing Chen, Narunas Vaskevicius, Luigi Palmieri, Jonathan Francis, Oliver Kroemer
  • 9th Conference on Robot Learning (CoRL 2025)
Publikationen

Niu et al., 2025

Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pre-Training
  • Yaru Niu, Yunzhe Zhang, Mingyang Yu, Changyi Lin, Chenhao Li, Yikai Wang, Yuxiang Yang, Wenhao Yu, Tingnan Zhang, Zhenzhen Li, Jonathan Francis, Bingqing Chen, Jie Tan, Ding Zhao
  • Robotics Science and Systems Conference (RSS 2025)

Ihr Kontakt zu mir

Jonathan Francis, Ph.D.
Lead Research Scientist, Robot Learning und Multimodal Machine-Learning

Teile diese Seite auf