Sprachtechnologie

Andreas Mühlbauer,

Intelligente Sprachassistenten „made in Germany“

Sprachassistenzsysteme schaffen auch in der Industrie einen Mehrwert, indem sie Prozesse effizienter gestalten und Mitarbeitende entlasten.

Sprachassistenten schaffen in der Industrie zunehmend einen Mehrwert. © Fraunhofer IAIS

Auf der Suche nach hochwertigen Lösungen werden Unternehmen auch in Deutschland fündig. Expertinnen und Experten der Fraunhofer-Gesellschaft entwickeln Sprachassistenten für Wirtschaft und Industrie, bei denen neben Performance und Sicherheit auch der Datenschutz an höchster Stelle steht.

Als Gerrit Holzbach kritisch die Oberfläche einer Motorhaube prüft, entdeckt er einen Fehler und zeigt auf die Stelle. „Da ist eine Vermattung“, stellt er fest. „Okay, Vermattung“, bestätigt nicht etwa ein menschlicher Kollege, sondern ein multimodaler Assistent, kurz „MuDA“. Das System markiert den Fehler, indem es einen Lichtpunkt darauf projiziert, und startet auf Gerrit Holzbachs Befehl hin, „Repariere diesen Fehler“, sofort die Reparatur. Ein Roboter-Arm nähert sich der markierten Stelle millimetergenau und behandelt sie mit seinem Polieraufsatz. „Reparatur des Fehlers Vermattung wurde abgeschlossen“, berichtet MuDA und wartet schon auf den nächsten Auftrag.

Dialogsysteme wie der multimodale Dialogassis-tent zeigen: Neue Interaktionsformen mit technischen Geräten über Sprache haben großes Potenzial, Mitarbeitende in Unternehmen zu entlasten, Prozesse zu beschleunigen und dabei die Qualität der Arbeit zu steigern. In unterschiedlichen Branchen werden KI-basierte Sprachlösungen bereits eingesetzt – als eines der europaweit führenden Wissenschaftsinstitute auf dem Gebiet der Künstlichen Intelligenz entwickelt das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS derartige Sprachtechnologien für unterschiedliche Anforderungen und Bereiche.

Anzeige

„Wir arbeiten mit verschiedenen Unternehmen zusammen, ermitteln den jeweiligen Bedarf und entwickeln daraufhin maßgeschneiderte Lösungen“, sagt Oliver Walter, Experte für Sprachtechnologie am Fraunhofer IAIS. So ist zum Beispiel in der Medien-Branche eine Software für Sprach- und Sprechererkennung von Fraunhofer IAIS bereits seit mehreren Jahren im Einsatz: Mit einem speziell für die ARD entwickelten Audio-Mining-System können Mitarbeitende unter anderem innerhalb von Videos nach Begriffen oder Personen suchen oder in Archiven relevante Inhalte wie Beiträge oder Dateien schnell wiederfinden.

Andere Sprachassistenz- oder Dialogsysteme wie der multimodale Assistent MuDA vereinen gleich mehrere Sprachtechnologien miteinander. Eine Komponente ist dabei die Spracherkennung. Danach folgt das Sprachverstehen, auch Natural Language Understanding (NLU) genannt. „Wie der Name sagt, ermöglichen NLU-Systeme es, Texte oder gesprochene Sprache mithilfe von KI zu verstehen und zu interpretieren. Das spart Unternehmen Zeit und macht Arbeitsabläufe effizienter“, erklärt Oliver Walter. „Darüber hinaus müssen KI-Systeme die Anfragen aber auch richtig interpretieren und insbesondere in der Industrie mit spezifischem Fachwissen antworten können.“ Dabei kommen sogenannte Wissensgraphen zum Einsatz, welche die Beziehung zwischen Wörtern und ihrer Bedeutung codieren. Dadurch lässt sich komplexes Wissen in einem Netzwerk verknüpfen und von Maschinen interpretieren. Zuletzt übernimmt die Sprachsynthese die Umwandlung von Text in gesprochene Sprache. „Diese Komponente kennen viele bereits von Smart-Home-Assistenten, die nicht nur unsere Befehle und Fragen aufnehmen, sondern auch darauf antworten“, sagt der Fraunhofer-Wissenschaftler. Auch im Arbeitsleben habe diese Technologie rund um das sogenannte „Question-Answering“ enormes Potenzial, zum Beispiel wenn es darum geht, in kurzer Zeit spezifisches Wissen aus großen Datenbeständen abzufragen.

Sprach- und Gestensteuerung für natürliche Interaktion

Der Assistent MuDA geht noch einen Schritt weiter und kombiniert Spracherkennung mit Gestensteuerung. Die Entwicklung des Fraunhofer CCIT-Forschungszentrums Maschinelles Lernen lässt sich in der Qualitätssicherung der Industrie einsetzen, speziell zur Fehleridentifikation und -markierung an Oberflächen. „Die Qualitätssicherung ist ein wichtiger Bestandteil von Produktionsprozessen, aber zugleich häufig komplex, aufwendig und kostenintensiv“, sagt Walter, der das MuDA-Projekt am Fraunhofer IAIS leitet. Um diesen komplexen Anforderungen gerecht zu werden, wurde ein Robotiksystem des Fraunhofer-Instituts für Optronik, Systemtechnik und Bildauswertung IOSB in Kooperation mit dem Fraunhofer IAIS zum multimodalen Dialogassistenten weiterentwickelt. Er ermöglicht eine automatisierte Fehlerdokumentation und -behandlung, und unterstützt den Menschen dabei von der Markierung bis zur Ausbesserung.

Fehlermarkierung durch Zeigegeste und Spracheingabe. © Fraunhofer CCIT

Die Interaktion von Mensch und Maschine über Spracheingabe kann viele Prozesse vereinfachen. Ein Vorteil sei es zum Beispiel, dass die Hände der Mitarbeitenden frei seien und parallel für andere Aufgaben genutzt werden könnten, sagt Walter. Auch mühsame Aufgaben wie etwa die Dokumentationspflicht würden erleichtert. „So ermöglichen wir unseren Partnerunternehmen zum Beispiel die Dokumentation in der Wartung von Maschinen, um Mängel unkompliziert und präzise für andere Mitarbeitende aufzunehmen.“ Bei MuDA können Anwenderinnen und Anwender neben Sprache zusätzlich Gesten nutzen, um mit der Maschine zu interagieren. Fehlerstellen an einem Bauteil werden per Fingerzeig intuitiv markiert und dann über eine Kamera erfasst. Metadaten, etwa um welche Art von Fehler es sich handelt, lassen sich über ein Sprachdialogsystem eingeben. In der Nachbesserungsphase wird der markierte und dokumentierte Fehler schnell wiedergefunden.

Während viele Einsatzfälle bereits erfolgreich verlaufen, gibt es nach wie vor Herausforderungen in der globalen Forschung und Entwicklung von Sprachtechnologien. Das Verstehen von gesprochener Sprache, etwa bei komplexen Fragestellungen oder Spracheigenheiten von Menschen wie Aussprache und Dialekt, überfordert viele Systeme noch. Doch auch hier haben die Expertinnen und Experten des Fraunhofer IAIS bereits Lösungen entwickelt. So wird deren automatisierte Spracherkennung unter anderem vom Sächsischen Landtag für die Live-Untertitelung von Plenumssitzungen genutzt, in denen viele Teilnehmende den sächsischen Dialekt sprechen. In der Entwicklung der Sprachsynthese stehen Expertinnen und Experten zudem vor der komplexen Aufgabe, dem Assistenten eine möglichst natürliche Stimme zu geben. „Dafür hat zum Beispiel das Fraunhofer-Institut für Integrierte Schaltungen IIS eine Sprachsynthesekomponente entwickelt, welche so natürlich klingt, dass diese kaum von der natürlichen Stimme zu unterscheiden ist. Diese wird bereits im gemeinsamen ‚Speaker‘-Projekt eingesetzt, wo sie die Basis der Sprachausgabe für alle dort entwickelten Sprachassistenten bildet“, sagt Oliver Walter.

Datensouveränität für Unternehmen

„Eine weitere Anforderung, die wir sehr ernst nehmen, ist das Thema Datenschutz und -souveränität“, erklärt der Wissenschaftler. Im Gegensatz zu vielen großen Unternehmen aus Amerika und Asien setzen die Fraunhofer-Mitarbeitenden auf Lösungen, die die Prozessoptimierung mit dem ethischen und DSGVO-konformen Umgang mit Kundendaten wie auch Trainingsdaten der KI verbinden. Das ist auch eines der zentralen Ziele des vom Bundesministerium für Wirtschaft und Energie geförderten Speaker-Projekts. Hier arbeiten Expertinnen und Experten der Fraunhofer-Institute IIS und IAIS gemeinsam mit Partnerunternehmen aus Wirtschaft und Industrie zusammen, um eine Sprachassistenzplattform für Dialogsysteme im B2B-Bereich zu entwickeln, „made in Germany“. Zahlreiche Unternehmen unterschiedlicher Größen und Branchen sind bisher dem Speaker-Netzwerk als Partner beigetreten. Ein Teil davon entwickelt bereits gemeinsam mit dem Fraunhofer-Team Dialog-systeme für ihren konkreten Bedarf – von der Automobilindustrie über den Maschinenbau bis hin zur Dienstleistung.

„Wie die Beteiligung am Speaker-Projekt zeigt, wächst das Interesse an Sprachassistenzsystemen aktuell enorm“, sagt Walter. „Vor allem in der Industrie und dem B2B-Bereich.“ Während Off-the-shelf-Lösungen im Arbeitsumfeld keine zufriedenstellenden Ergebnisse liefern, sollten Unternehmen sich nicht davon abschrecken lassen, Systeme nach eigenem Bedarf anfertigen zu lassen. „Dank Big Data und intelligenten Algorithmen lassen sich maßgeschneiderte KI-Sprachsysteme heutzutage viel leichter und schneller umsetzen als viele glauben – Hand in Hand mit dem Menschen.“

Daria Tomala und Eléna Zay, Presse und Öffentlichkeitsarbeit Fraunhofer IAIS

Anzeige

Das könnte Sie auch interessieren

Anzeige

Meinung

Der intelligente Mensch in der Fabrik 4.0

Kürzlich las ich von einer Ausstellung, die dieser Tage in Venedig zu sehen ist: Homo Faber – der schaffende Mensch. Zu sehen ist dort luxuriöseste Handwerkskunst, bei der es auf Geschicklichkeit, Originalität und Kreativität ankommt.

mehr...
Anzeige
Anzeige
Anzeige

Assistenzsystem

Software hilft bei Qualitätskontrolle

Ob bei der Schulung neuer Mitarbeiter, bei der Unterstützung von Montagetätigkeiten – insbesondere variantenreicher Produkte – oder bei der Qualitätskontrolle: Assistenzsysteme werden immer wichtiger. Solche Systeme erweitern die Fähigkeiten des...

mehr...

KI

Schlauer Klaus sucht Handelspartner

Der Bildverarbeitungsspezialist Optimum GmbH hat mit dem „Schlauen Klaus“ ein intelligentes Assistenzsystem entwickelt, das Unternehmen und ihre Mitarbeiter in verschiedenen Bereichen der Wertschöpfung unterstützt. Nun wollen die Karlsruher ihr...

mehr...
Anzeige
Anzeige
Anzeige