Zum Hauptinhalt springen
Smart City

Der Kamera-Trainer

Wie Sicherheitskameras durch maschinelles Lernen freie Parkplätze erkennen

André-Luis Tournoux, ein Experte für Video Analytics, sitzt mit einer intelligenten Überwachsungskamera, einem Laptop und einem Miniatur-Parkplatz mit Miniatur-Autos darauf an einem Schreibtisch.

Sehen und verstehen – nach diesem Prinzip funktionieren intelligente Sicherheitskameras wie die Flexidome IP starlight 8000i Dome. Im Interview erklärt André-Luis Tournoux, ein Experte für Video Analytics, wie einfach das System funktioniert und welche neuen Möglichkeiten sich daraus ergeben.

Das intelligente, scharfe Auge

Wie bringt man einem Kind bei, wie ein Auto aussieht? Ganz einfach: indem man ihm ein Auto zeigt. Was sich beim Menschen bewährt hat, funktioniert jetzt auch bei Kameras – durch eine Software von Bosch namens Camera Trainer. Sie befähigt die Geräte zu maschinellem Lernen. Die Software lässt sich beispielsweise auf die Bosch-Sicherheitskamera Flexidome IP starlight 8000i Dome aufspielen und ermöglicht damit ganz neue Anwendungen. Bei der Flexidome-Kamera wurden grundlegende Funktionen verbessert: die Bildauflösung ist höher, die Lichtempfindlichkeit wurde optimiert und die Inbetriebnahme lässt sich nun bequem per Smartphone oder Tablet erledigen. Camera Trainer ist jedoch die größte Innovation, die in dem Gerät steckt. Warum? Das erzählt André-Luis Tournoux.

Die Sicherheitskamera Flexidome IP starlight 8000i Dome von Bosch mit Gebäuden im Hintergrund.
In ihr arbeitet ein Machine-Learning-Algorithmus: Die Flexidome IP starlight 8000i Dome von Bosch.
André-Luis Tournoux sitzt auf einer Bank und erklärt einem nicht sichtbaren Publikum etwas.
André-Luis Tournoux erklärt die Technologie hinter Camera Trainer.

Herr Tournoux, was ist Camera Trainer?
Eine Software für maschinelles Lernen (ML), die direkt auf die Netzwerkkameras von Bosch gespielt werden kann. Die Kamera lässt sich dadurch auf die Erkennung von Objekten und Situationen „trainieren“. Erkennt die Kamera das festgelegte Szenario, führt sie in Echtzeit eine vordefinierte Aktion aus – zum Beispiel eine Zählung oder einen Alarm.

Wie trainiert man denn eine Kamera?
Wie bei vielen anderen Machine-Learning-Softwares werden auch hier Beispielbilder von den Objekten benötigt. Man zeigt der Software, welche Objekte oder Situationen relevant sind. Bei Camera Trainer reichen je nach Anwendung 25 bis 250 Bilder – und schon lernt die Software, wie beispielsweise ein Auto aussieht.

25

Beispielbilder können für die Erkennung eines Objekts mit Camera Trainer bereits ausreichen.

André-Luis Tournoux im Showroom von Bosch Building Technologies in Eindhoven vor mehreren Bildschirmen, die Kameraaufnahmen zeigen.
Er hat den Überblick: André-Luis Tournoux im Showroom von Bosch Building Technologies in Eindhoven.

Was muss der Mensch dabei genau machen und was erledigt die Technologie?
In einem Softwareprogramm markieren die Nutzer relevante Dinge auf Bildern, indem sie ganz einfach mit der Maus ein Kästchen um sie ziehen. Das System merkt sich die Umrisse der Objekte und kann diese dann von allein erkennen. Man spricht hier von einem Positivbeispiel. Nach dem gleichen Muster werden Negativbeispiele erstellt. Das sind alle Dinge oder Hintergründe, bei denen es sich nicht um das relevante Objekt handelt.

Geben Sie uns bitte ein Anwendungsbeispiel.
Die Möglichkeiten der Technologie lassen sich auf verschiedene Situationen anwenden. Mit der Software kann eine Kamera zum Beispiel selbstständig erkennen, ob ein Parkplatz belegt ist oder nicht. Dazu markiert man auf Bildern Fahrzeuge als Positivbeispiele und freie Parkplätze als Negativbeispiele. Die Software lernt also, wie ein Auto aussieht und wie ein leerer Parkplatz aussieht. Anschließend kann sie beides voneinander unterscheiden. Das Ergebnis: Per Videokamera lässt sich automatisch ermitteln, wie viele freie Parkplätze es auf einer bestimmten Fläche gibt.

In drei Schritten zur Parkplatzkontrolle: So lernt Camera Trainer

Ein Miniaturparkplatz mit Spielzeugautos darauf von oben. Eine weiß-blaue Markierung um die Parkplätze soll zeigen, wie der Camera Trainer-Software das Erkennen der Parkplätze gezeigt wird.
Im Wesentlichen lernt die Camera Trainer-Software in drei Schritten alle für sie relevanten Dinge. In diesem Beispiel soll die Kamera belegte Parkplätze erkennen. Im ersten Schritt wird dazu der Bereich ausgewählt, auf den es ankommt. In einem Konfigurationsprogramm wird mit der Maus der Parkplatz markiert.
Ein Miniaturparkplatz mit Spielzeugautos darauf von oben. Eine weiß-grüne Markierung um eines der Spielzeugautos soll zeigen, wie der Camera Trainer-Software das Erkennen der von Fahrzeugen gezeigt wird.
Im zweiten Schritt werden die Objekte markiert, die erkannt werden sollen. Hier sind es Fahrzeuge. Der Machine-Learning-Software wird also beigebracht, wie ein Auto aussieht. Dazu werden verschiedene Autos markiert. So lernt die Software deren typische Umrisse.
Ein Miniaturparkplatz mit Spielzeugautos darauf von oben. Eine weiß-rote Markierung um einen nicht belegten Parkplatz soll zeigen, wie der Camera Trainer-Software das Erkennen der von freien Parkplätzen gezeigt wird.
Im dritten Schritt wird der Software gezeigt, was „kein Auto“ ist. Kein Auto heißt in diesem Fall: ein freier Parkplatz. Die Schritte zwei und drei werden so lange wiederholt, bis Camera Trainer die Unterscheidung von alleine treffen kann und Autos und freie Parkplätze automatisch anzeigt.
Ein Miniaturparkplatz mit Spielzeugautos darauf von oben. Eine Markierung den Parkplatz sowie die einzelnen Fahrzeuge zeigt, wie die Kamera die Fahrzeuge erkennt. Im linken oberen Bildschirmrand wird die Anzahl der Fahrzeuge aufgeführt.
Verstanden! Die Software hat gelernt wie ein Auto und ein freier Parkplatz aussehen. Jetzt wird das Wissen angewendet. In unserem Beispiel zählt die Kamera dank der Software automatisch belegte Parkplätze. Links oben im Bild das Ergebnis: In der oberen Reihe steht ein Auto, in der unteren stehen zwei.
Ein Miniaturparkplatz mit Spielzeugautos darauf. Eine Markierung der Parkplatz sowie die einzelnen Fahrzeuge zeigt, wie die Kamera die Fahrzeuge erkennt. Im linken oberen Bildschirmrand wird die Anzahl der Fahrzeuge aufgeführt.
Natürlich sind auch weitere Szenarien interessant: Zum Beispiel kann Camera Trainer die Zeit stoppen, wie lange ein Auto parkt.
/

Was ist das Besondere an dieser Lösung?
Es gibt da zwei Dinge. Erstens: Die intelligente Videoanalyse ist bereits jetzt sehr gut darin, bewegliche Objekte zu erkennen. Das entlastet Menschen – sie müssen nicht mehr die ganze Zeit auf einen Bildschirm starren und sich darauf konzentrieren, ob etwas passiert. Camera Trainer ermöglicht nun noch mehr Entlastung. Dank der Software lassen sich per Videoanalyse auch solche Objekte erkennen und beobachten, die sich nicht bewegen. So kann beispielsweise ermittelt werden, wie lange ein Auto auf einem Parkplatz steht.

Und zweitens?
Prinzipiell ist auf Sicherheitskameras wenig Rechenleistung vorhanden – dass man darauf Machine-Learning-Algorithmen laufen lässt, ist schon einzigartig. Die Technologie von Bosch schafft das, weil sich die vergleichsweise aufwendige Erkennung der Objekte und Hintergründe auf einem herkömmlichen Computer mit dem Camera Trainer-Konfigurator erledigen lässt und dann als schlankes Softwareprogramm auf die Kamera hochgeladen wird. Hier hat das große Know-how in unserem Unternehmen eine wichtige Rolle gespielt. Der Algorithmus wurde beispielsweise von der Abteilung Connected Mobility und Computer Vision aus dem Zentralbereich Forschung und Vorausentwicklung programmiert. Das Produktmanagement des Geschäftsbereichs Building Technologies stellte sicher, dass Camera Trainer sich in die Kamera integrieren lässt.

André-Luis Tournoux im Gespräch mit einem nicht sichtbaren Gesprächspartner.

Welche Weiterentwicklung steht bei intelligenten Sicherheitskameras als nächstes an?
Die Sicherheitsbranche muss über die Art und Weise nachdenken, wie sie Lösungen für smarte Kameras entwickelt. Unsere neue Plattform INTEOX weist hier den Weg: Über sie können Programmierer individuelle Softwareanwendungen für die intelligente Videoanalyse anbieten. Das Betriebssystem von INTEOX basiert auf Android Open Source Project. Somit ist die Plattform für jeden offen, der Apps erstellen möchte. Diese können dann wie Camera Trainer auf Sicherheitskameras geladen werden – das Prinzip gleicht einem App-Store für Smartphones.

Im Fokus

André-Luis Tournoux angelehnt an einen Tisch mit kleinen Spielzeugfahrzeugen darauf.

André-Luis Tournoux

Video Analytics & Business Intelligence Developer bei Bosch Building Technologies

Ich sammle ständig neues Wissen über IT und technische Innovationen.

Für André-Luis Tournoux ist die Welt ein Dorf. Der Franzose studierte in Brasilien und Frankreich angewandte Mathematik, Computerphysik und Finanzlehre und arbeitete bereits im Bereich Management und IT-Entwicklung, ehe er 2017 zu Bosch in die Niederlande wechselte. Wenn er nicht gerade arbeitet, treibt er Wassersport und bereist die Erde – in 60 Ländern war er schon.

Teile diese Seite auf