Federated Learning
Innovative Methode in der Qualitätssicherung
Federated Learning hat sich als innovative Methode im Bereich der Qualitätssicherung etabliert, insbesondere in Szenarien, in denen Unternehmen sensible Produktionsdaten schützen möchten, aber dennoch von kollaborativen Modellen profitieren wollen.
Die industrielle Produktion steht zunehmend vor Anforderungen hinsichtlich Datensouveränität, Datenschutz und individuellen Produktionsbedingungen. Federated Learning (FL) bietet hierbei den Vorteil, dass Unternehmen trotz strikter Datenschutzbestimmungen oder wettbewerbsbedingter Datensilos gemeinsam Modelle trainieren können. Zudem können durch die Diversität der Daten bei unterschiedlichen Partnern robustere und generalisierbare Modelle entstehen.
Im Gegensatz zum klassischen zentralisierten maschinellen Lernen, bei dem eine Zusammenführung aller Daten an einem zentralen Ort erforderlich ist, ermöglicht FL ein dezentrales Training eines globalen Modells direkt bei den einzelnen Produktionsanlagen, ohne dass ein Austausch von Rohdaten notwendig ist. Diese Methode erweist sich als besonders interessant für Unternehmen, die über eine eingeschränkte Menge an Daten einer spezifischen Klasse verfügen, beispielsweise bei der Erkennung defekter Teile oder bei der Analyse von Daten mit geringer Varianz, wie sie durch die Verwendung derselben Kamera in einer konstanten Perspektive entstehen. Durch die virtuelle Erweiterung der Datenbasis hilft FL, einer Überanpassung an Trainingsdaten (Overfitting) effektiv vorzubeugen. Federated Averaging (FedAvg) ist die ursprüngliche und eine der am weitesten verbreiteten Aggregationsmethoden im Federated Learning. Der Ablauf erfolgt in mehreren Schritten:
- Initialisierung: Ein globales Modell wird auf einem zentralen Server initialisiert und anschließend an alle teilnehmenden Clients gesendet
- Lokales Training: Jeder Client trainiert das Modell unabhängig auf seinen lokalen Daten über mehrere Epochen
- Modellupdate: Nach Abschluss des lokalen Trainings senden die Clients ihre aktualisierten Modellparameter zurück an den zentralen Server
- Aggregation: Der Server aggregiert die empfangenen Modellupdates typischerweise durch Mittelwertbildung, um ein verbessertes globales Modell zu erstellen
- Verteilung des Modells: Das neue, aggregierte Modell wird wiederum an alle Clients verteilt, um die nächste Trainingsrunde zu beginnen
Dieser Zyklus wird wiederholt, bis eine festgelegte Genauigkeit oder Konvergenz erreicht ist.
Möglichkeiten und Herausforderungen Federated Learning ermöglicht es, ähnliche Prozesse auf vergleichbaren Maschinen miteinander zu kombinieren. Dies bedeutet, dass Umwelteinflüsse, wie etwa erhöhte Temperaturschwankungen bei Maschinen, die direkter Sonneneinstrahlung ausgesetzt sind, oder erhöhter Verschleiß bei älteren Maschinen, inhärent im Modell berücksichtigt werden. Dadurch können Erfahrungen, die bei einer Maschine gesammelt wurden, schnell und effektiv auf andere übertragen werden, sodass diese rechtzeitig darauf reagieren können.
Dennoch stehen FL-Systeme vor vielfältigen Herausforderungen. Sofern eine hohe Datenheterogenität vorliegt, etwa aufgrund einer nicht uniform verteilten Datenbasis oder der Tatsache, dass einzelne Clients signifikant mehr Daten besitzen als andere, müssen komplexere Selektionsstrategien zum Einsatz kommen. Solche Strategien zielen darauf ab, während des Trainings möglichst alle Datenverteilungen zu berücksichtigen. Darüber hinaus erfordern Modell- oder Hardware-Heterogenitäten weiterführende Aggregationsverfahren. Gängige Aggregationsmethoden wie FedAvg erweisen sich in solchen Fällen häufig als unzureichend, um stark unterschiedliche lokale Datenverteilungen effizient zu integrieren.
Zur Bewältigung dieser Herausforderungen wurden unterschiedliche Ansätze entwickelt. Die Kombination von Federated Learning mit Ensemble Learning beispielsweise zeigt sich allgemein robust gegenüber lokaler Datenvarianz und liefert präzisere Ergebnisse bei verschiedenen Anwendungen der Qualitätsinspektion. Zusätzlich wurden Sampling-Strategien eingeführt, die gezielt solche Clients auswählen, deren Daten besonderen Mehrwert für das globale Modell haben, wodurch die Kommunikation effizienter gestaltet werden kann. Darüber hinaus bieten personalisierte Aggregationstechniken die Möglichkeit, lokale Modellupdates individueller zu gewichten, was die Generalisierung der Modelle über die verschiedenen lokalen Bedingungen hinweg verbessert.
Um die Sicherheit weiter zu erhöhen, können zusätzliche Schutzmaßnahmen implementiert werden. Differential Privacy etwa fügt kontrollierte, zufällige Störungen zu den Modellupdates hinzu, wodurch Rückschlüsse auf spezifische Datensätze einzelner Clients verhindert werden. Secure Multiparty Computation (SMPC) erlaubt es, Berechnungen auf verschlüsselten Daten durchzuführen, sodass der zentrale Server keine Einsicht in die tatsächlichen Modellupdates hat. Homomorphic Encryption ermöglicht Berechnungen direkt auf verschlüsselten Daten, ohne diese entschlüsseln zu müssen, und gewährleistet somit zusätzliche Privatsphäre.
Ausfallzeiten vorhersagen und Wartungsmaßnahmen planen
Die Praxistauglichkeit von FL wurde in diversen Szenarien der Qualitätssicherung nachgewiesen. In der prädiktiven Wartung ermöglichen federierte Modelle die effiziente Überwachung des Zustandes von Maschinen und Anlagen an unterschiedlichen Standorten. Durch das Sammeln von Erkenntnissen aus mehreren Produktionsumgebungen, ohne Rohdaten zu teilen, können Ausfallzeiten präzise vorhergesagt und Wartungsmaßnahmen besser geplant werden.
Ebenso bietet FL große Vorteile bei visuellen Inspektionsverfahren. Produktionsstätten mit unterschiedlichen Beleuchtungsbedingungen, Maschinentypen und Fehlerbildern profitieren von einem global trainierten Modell, das durch dezentrale Lernprozesse kontinuierlich verbessert wird. Insbesondere bei der Erkennung feiner Risse, Kratzer oder Korrosion können federierte Ansätze deutlich zuverlässigere Ergebnisse erzielen als lokal isolierte Modelle.
Zukünftige Forschung wird sich auf adaptive Strategien zur Bewältigung dynamischer Produktionsbedingungen und weiterer Optimierung der Client-Selektion sowie auf den Einsatz hybrider Modelle konzentrieren. Zudem werden Forschung und Praxis vermehrt untersuchen, wie KI-gestützte Qualitätssicherungsverfahren durch die Integration von Echtzeitdatenanalyse und Edge-Computing noch effizienter gestaltet werden können. Damit wird Federated Learning zu einem Schlüsselinstrument moderner Industrie-4.0-Strategien und unterstützt nachhaltig die Entwicklung flexibler, sicherer und hochpräziser Qualitätssicherungsverfahren.
Aus der Praxis: Qualitätssicherung bei Huawei
Tatjana Legler leitet ein FL-Projekt mit Huawei, bei dem die SmartFactory Kaiserslautern und die RPTU Kaiserslautern zusammenarbeiten. Sie ist KI-Expertin und stellvertretende Leiterin des Lehrstuhls Werkzeugmaschinen und Steuerung an der RPTU Kaiserslautern-Landau. Im Use-Case wurden die Oberflächen von USB-Sticks untersucht, die sich in Fertigungsverfahren, Form und Farbe unterschieden. Eine normale Industriekamera fertigte Aufnahmen an, das vortrainierte KI-Modell arbeitete lokal an der Kamera. Wurde eine Abweichung beim Stecker festgestellt, wurde das Werkstück automatisiert ausgeschleust. Nach einer relevanten Trainingseinheit werden neue Netzwerkgewichte, die aus Millionen Datenwerten zwischen 0.0 und 0.1 bestehen und abstrakt den Fehler beschrieben, aber keine Rückschlüsse auf das Werkstück zuließen, hochgeladen. Der zentral gespeicherte Algorithmus wurde mit den dezentral erfassten Datenparametern optimiert und floss zurück in die lokalen Anwendungen, die so ebenfalls verbessert weiterarbeiten konnten. „Die Vorteile liegen auf der Hand“, erklärt Legler. „Ein Fehler, der bei uns auftauchte, konnte bei Huawei erkannt werden, ohne dass er dort jemals vorher aufgetaucht ist. Eine klassische Win-Win-Situation.“
In Deutschland wurde der Use-Case erstmals 2023 auf der Hannover Messe präsentiert. International stellte das Team Prof. Martin Ruskowski (links), Tatjana Legler (Mitte) und Vinit Hegiste erste Erkenntnisse Ende 2023 auf dem AI Hardware & Edge AI Summit in Kalifornien vor.
Automatica, Halle B6, Stand 502










