Interaktion von Mensch und Maschine: Menschliche Bewegung im industriellen Umfeld zuverlässig erkennen

Interaktion von Mensch und Maschine

von Gabriele Fulco | Redaktion: Inka Krischke, 08.12.2025, 11:18

Menschliche Bewegung zuverlässig erkennen

Die genaue Erkennung von Menschen im industriellen Umfeld ist eine besondere Herausforderung. Doch was genau macht es so schwierig, Menschen zuverlässig zu erkennen?

Menschliche Bewegung im industriellen Umfeld zuverlässig erkennen

Bilder

Eine Maschine so zu trainieren, dass sie die Welt um sich herum nicht nur wahrnimmt, sondern auch versteht, ist eine komplexe technologische und rechnerische Herausforderung. Eine noch weitaus komplexere Aufgabe ist die Erkennung von Menschen, da die Einzigartigkeit und Vielfalt des Menschen diesen zu einem der schwierigsten zu erkennenden Objekte machen, wenn ein System nicht ausgiebig auf bestimmte Personen trainiert werden soll. So kann bereits eine Änderung der Kleidung oder der Frisur zu Problemen in der Erkennung führen. Kommen zusätzliche Faktoren wie ein räumlich ausgedehntes Interaktionsumfeld oder die Unvorhersehbarkeit menschlichen Verhaltens hinzu, wachsen die technischen Herausforderungen schnell.

In Industrieumgebungen beispielsweise arbeiten oft mehrere Menschen in hoher Geschwindigkeit und führen verschiedene Aufgaben im selben Raum aus. Der Versuch, deren Bewegungen aus einer seitlichen oder gar isometrischen Ansicht zu verfolgen, hat bisher nur unzureichende Lösungen gebracht, da eine solche Lösung ein Verständnis des Systems für die Tiefe der Sicht voraussetzt. Bei einer Konfiguration mit nur einer Kamera kann eine Person zudem leicht die Sichtung einer anderen verdecken und tote Winkel schaffen.

Eine der größten Herausforderungen bei der Entwicklung von Bildverarbeitungssystemen findet sich darüber hinaus nicht so sehr in der Erfassung von Bildern, sondern vielmehr in deren Verarbeitung. Damit eine Maschine menschliche Bewegungen in Echtzeit verstehen kann, ist eine starke Rechenleistung erforderlich, um sowohl hohe Geschwindigkeit als auch Genauigkeit zu gewährleisten. Da keine Umgebung der anderen gleicht, war die Entwicklung eines Systems, das nicht nur die Nuancen menschlicher Bewegungen verstehen, sondern sich auch unterschiedlichen Szenarien und Beleuchtungsniveaus anpassen kann, bislang ein Hindernis für die breite Anwendung solcher Technologien.

Eine andere Perspektive

Interaktion von Mensch und Maschine: Menschliche Bewegung zuverlässig erkennen

Schema der Installation © Omron

Menschenerkennungssysteme beruhen typischerweise auf einer Top-Down-Perspektive (von oben nach unten) und nehmen ähnlich wie Sicherheitskameras Bilder auf. Dieser Top-Down-Ansatz ist deshalb üblich, da es eine Fülle von öffentlich zugänglichen Bildaufnahmen aus diesem Blickwinkel gibt, die für das Training von KI-Modellen verwendet werden. Aus der Vogelperspektive ist es für Erkennungs-systeme jedoch schwierig, die Position von Menschen im Detail zu erfassen, vor allem, wenn sich Personen in der Szene überschneiden. Das macht es weniger effektiv für Unterstützungsaufgaben wie etwa die Verbesserung der Arbeitseffizienz.

Omron hat sich für das Kamerasystem ‚AM1‘ daher für ein Training anhand von Bildern entschieden, die von vorn aufgenommen wurden, das heißt aus der gleichen Perspektive, aus der ein Kollege den anderen sehen würde. Da solche Bilder im Internet jedoch nur selten zu finden sind, wurden die KI-Modelle mit einem eigenen, proprietären Datensatz erstellt und trainiert. Dieser Ansatz verleiht dem System, das für menschliche Produktivität in industriellen Umgebungen entwickelt wurde, einen Vorteil bei der Erkennung und Analyse menschlicher Bewegungen. Es verwendet eine einzelne Top-Down-Kamera in Kombination mit einer Software, die speziell zur Erkennung und Interpretation menschlicher Bewegungen optimiert wurde.

Menschliche Bewegungsmuster

Das AM1-System wird mit Standbildern und nicht mit Bewegungsabläufen trainiert. Allerdings hat Omron eine Vielzahl von Körperhaltungen und Bewegungsmustern in diese Standbilder aufgenommen, um sicherzustellen, dass typische menschliche Verhaltensweisen wie Gehen, Stehen, Bücken oder Greifen umfassend erfasst werden. Die KI ist darauf trainiert, diese statischen Posen zu erkennen, die bei der Verarbeitung in Echtzeit dynamische Bewegungen darstellen. Dieser Ansatz benötigt keine Millionen von Trainingsbildern; stattdessen deckt ein sorgfältig ausgewählter Satz von Bildern die wichtigsten Körperhaltungen und Szenarien ab. So lässt sich das System effizient trainieren, ohne auf einen übermäßig großen Datensatz angewiesen zu sein.

Erfassungsbereich und Bildrate

Die Software kann bis zu zehn Personen innerhalb eines 7 m × 7 m großen Bereichs mit einer Genauigkeit von über 95 Prozent erfassen. Auf diese Weise ist verfolgbar, wo und wie sich Mitarbeiter bewegen oder wie lange sie sich an einem bestimmten Ort aufhalten. Diese Art von Informationen können Unternehmen nutzen, um Engpässe zu erkennen und sicherzustellen, dass Raumnutzung und Arbeitsabläufe so effizient wie möglich sind. In der Praxis könnte dies bedeuten, Hindernisse auf Wegen zu beseitigen, die am häufigsten benutzten Wege zu verkürzen oder die Wahrscheinlichkeit zu verringern, dass Arbeitnehmer den Weg eines anderen kreuzen müssen. Indem Probleme früher erkannt und verstanden werden, lassen sich schneller Lösungen auf der Basis eines datengestützten Ansatzes finden.

Die Genauigkeit des AM1 wird durch eine Bildrate von zehn Bildern pro Sekunde erreicht. Die Bilddaten der Kamera, oder gegebenenfalls mehrerer Kameras, werden über Ethernet in einen Verarbeitungs-Hub eingespeist, der von einem ‚OpenVino‘-Beschleuniger von Intel betrieben wird.

Bei der Installation mehrerer Kameras werden Positions- und ID-Informationen an das System übertragen und zu einer Karte kombiniert. © Omron

In Fällen, in denen größere Bereiche abgedeckt werden müssen zum Beispiel in Räumen, die größer als 7 m × 7m sind, ist es möglich, die Ergebnisse mehrerer Kameras zu kombinieren. Indem die Bilder der einzelnen Kameras zusammengefügt und überlappende Bereiche entfernt werden, kann das System ein nahtloses, größeres Sichtfeld erzeugen.

Der ‚OpenVino‘-Beschleuniger

Das OpenVino-Toolkit (Open Visual Inference and Neural Network Optimization) von Intel ist ein Software-Framework zur Beschleunigung der Leistung von Deep-Learning-Modellen für Computer-Vision-Anwendungen. Es optimiert vortrainierte KI-Modelle für die effiziente Ausführung auf Intel-Hardware, einschließlich CPUs, integrierten GPUs, FPGAs und speziellen Beschleunigern.

Im Fall des AM1-Systems dient das Toolkit als Beschleuniger, indem es die Modelle zur Menschenerkennung und Bewegungsinterpretation schneller und effizienter auf Standard-Computerplattformen laufen lässt. Dadurch wird die Inferenzzeit (das heißt, die Zeit, die für die Verarbeitung neuer Bilder und die Generierung von Erkennungsergebnissen benötigt wird) erheblich verkürzt, was für Echtzeitanwendungen in industriellen Umgebungen entscheidend ist. Im Wesentlichen trägt OpenVino dazu bei, dass das AM1-System eine schnelle, zuverlässige und genaue Erkennung von Menschen ermöglicht, ohne dass High-End- oder Spezialhardware erforderlich ist.

Gabriele Fulco ist Product Marketing Manager bei Omron Electronic Components Europe. © Omron

Hierdurch ist es dem System möglich, Rohdaten schnell in nützliche Informationen umzuwandeln. ‚Schnell‘ bezieht sich in diesem Zusammenhang auf die Fähigkeit des Systems, Bilddaten zu verarbeiten und die Anwesenheit oder Körperhaltung von Menschen in Echtzeit oder nahezu in Echtzeit zu erkennen. Das AM1-System kann menschliche Positionen mit minimaler Verzögerung, in der Regel innerhalb von Millisekunden, erkennen und analysieren kann, so dass es sofort auf Veränderungen in der Umgebung reagieren kann.

Für industrielle Anwendungen ist dieses Geschwindigkeitsniveau unerlässlich, um einen reibungslosen Betrieb zu gewährleisten, Engpässe zu vermeiden und Sicherheitsprotokolle zu unterstützen. Wird das System beispielsweise zur Überwachung der Anwesenheit von Mitarbeitern in einem Gefahrenbereich oder zur Optimierung der Effizienz von Arbeitsabläufen eingesetzt, muss es menschliche Bewegungen ohne spürbare Verzögerung erkennen und darauf reagieren. Nach der Verarbeitung werden die Informationen dann für menschliche Bediener an einen Standard-PC oder eine SPS weitergeleitet.

Dank Omrons umfangreicher Datenbibliothek, die in jahrelanger Entwicklung von Bildverarbeitungslösungen gesammelt wurde, muss das System nicht auf bestimmte Personen trainiert werden und kann jeden menschlichen Körpertyp erkennen. Daher sind für Nutzer keine besonderen Programmierkenntnisse erforderlich.

zurück zur Themenseite

Das könnte Sie auch interessieren

Sensor+Test 2026

Vom Sensor zum intelligenten System

Sensorik, Messtechnik und Künstliche Intelligenz verschmelzen zu intelligenten Systemen. Die Sensor+Test zeigt vom 9. bis 11. Juni 2026 in Nürnberg die wichtigsten Trends einer Branche im Wandel.

mehr...

KI-Automatisierer ordnet Führung neu

Generationswechsel bei Insiders Technologies

Nach fast 30 Jahren an der Spitze übergibt Werner Weiss die Führung von Insiders Technologies. Andree Albrecht übernimmt nach einer Übergangsphase die Geschäftsführung.

mehr...

Neue Vertriebs- und Serviceeinheit in Gurugram

Yamaha Motor baut Robotics-Geschäft in Indien aus

Yamaha Motor eröffnet in Indien eine neue Robotics Business Support Division zur Stärkung von Vertrieb und Service im wachsenden Robotikmarkt. Die Einheit soll unter anderem SMT-Systeme und Industrieroboter unterstützen und wird durch einen Showroom...

mehr...

Fertigungstechnologien

Ein Roboter für alle Fälle

Industrieroboter übernehmen viele Aufgaben. Sogar das Fräsen mit Genauigkeiten im Submillimeterbereich ist inzwischen möglich.

mehr...

Fabrikplanung ohne Druckluftnetz

Wie Vakuum mobil wird

Modulare Fabriken, mobile Robotik und steigende Energiepreise verändern die Automatisierung grundlegend. Eine Lösung: Ohne Druckluft in die Zukunft. Elektrische Vakuumsysteme senken Kosten, sparen Energie und unterstützen flexible Fertigungs- und...

mehr...

Synergie in der Sondermaschine

Hochautomatisierte Fertigungslinie für Gerüst-Standrohre setzt Maßstäbe in Effizienz und Prozesssicherheit

Wie entsteht eine der modernsten Gerüst-Rohrfertigungen Europas? Bei MJ-Gerüst läuft eine vollvernetzte Hightech-Linie, die alle 60 Sekunden sechs fertige Standrohre produziert. Mit Automatisierung, Robotik und Präzisionstechnik von Schunk. Wie...

mehr...

Qualitätskontrollen in der Fertigung

Roboter prüfen Bodenwannen von Autos vollautomatisch

Wie lassen sich komplexe Bauteile in der Automobilproduktion mithilfe von Machine Vision und Robotik vollständig automatisiert und in Echtzeit prüfen? Wie Bodenwannen vollautomatisch vermessen und geprüft werden, zeigt der Anwenderbericht.

mehr...

Mehr Leistung auf weniger Raum

Neue Antriebe und Bildverarbeitung für die vernetzte Produktion

B&R, die Machine Automation Division von ABB, stellt auf der all about automation in Wels neue Lösungen für den Maschinen- und Anlagenbau vor. Im Mittelpunkt stehen Antriebstechnik und industrielle Bildverarbeitung.

mehr...

IT/OT Integration Summit 2026

Offene Automatisierungs-Ökosysteme: Wie Kollaboration zum Wettbewerbsvorteil wird

Wie wird Kollaboration zwischen IT, OT und Maschinenbau zum echten Wettbewerbsvorteil? Hans Michael Krause zeigt, wie offene Automatisierungs-Ökosysteme Brownfield-Integration, KI und Cyber-Resilienz in der Praxis voranbringen.

mehr...

Menschliche Bewegung zuverlässig erkennen

Eine andere Perspektive

Menschliche Bewegungsmuster

Erfassungsbereich und Bildrate

Der ‚OpenVino‘-Beschleuniger

Das könnte Sie auch interessieren

Vom Sensor zum intelligenten System

Generationswechsel bei Insiders Technologies

Yamaha Motor baut Robotics-Geschäft in Indien aus

Ein Roboter für alle Fälle

Wie Vakuum mobil wird

Hochautomatisierte Fertigungslinie für Gerüst-Standrohre setzt Maßstäbe in Effizienz und Prozesssicherheit

Roboter prüfen Bodenwannen von Autos vollautomatisch

Neue Antriebe und Bildverarbeitung für die vernetzte Produktion

Offene Automatisierungs-Ökosysteme: Wie Kollaboration zum Wettbewerbsvorteil wird

Media

Service

Weitere Angebote

Über uns

Unser Netzwerk