Seit Jahrtausenden ist das Handwerk ein wichtiger Wirtschaftssektor in den Gesellschaften. Seien es die Steinmetze beim Bau der Pyramiden im heutigen Ägypten oder die Korbflechter im Nahen Osten. Die vielfältigen Berufe haben sich im Laufe der Zeit weiterentwickelt, Tradition und Moderne sind miteinander verschmolzen. So hält die Künstliche Intelligenz (KI) auch im Handwerk Einzug. Vor allem unliebsame Büroarbeit kann durch KI vereinfacht werden. Denn durch die einzelnen Tätigkeiten, die sich zwar ähneln, aber selten identisch sind, müssen für Dienstleistungen spezifische Angebote erstellt und an die jeweiligen Anforderungen angepasst werden. Insbesondere die Zuordnung einer Tätigkeit zu Ausschreibungstexten von Architekten oder öffentlichen Bauherren ist sehr zeitaufwändig.
Die Verarbeitung natürlicher Sprache ist seit einigen Jahren ein Forschungsfeld im Bereich der KI-Entwicklung. Nicht erst seit ChatGPT oder anderen Anbietern geht es darum, Sprache zu analysieren und daraus Wissen zu generieren. Unter dem Begriff Natural Language Processing (NLP) werden verschiedene Verfahren zur Analyse von Texten aller Art entwickelt und KI-Modelle zur Wissensgenerierung eingesetzt.
Quelle: © Frauke Riether - PixabayIm Mittelstand-Digital Zentrum Ilmenau wurde in Zusammenarbeit mit der Iceberg Images GmbH, der Alpha Analytics UG & Co. KG und der Phnx Alpha GmbH ein Demonstrator zur Auswertung von Ausschreibungstexten entwickelt. Als Datenbasis dienten digitale Aufzeichnungen aus über 10 Jahren Auftragsabwicklung. Die konsistente Speicherung der Daten in geeigneten Formaten in Verbindung mit dem dazugehörigen Wissen ermöglichte die Entwicklung eines KI-Modells zur Zuordnung von Aktivitäten zu einem Ausschreibungstext. Mit ca. 32.000 Texten und den zugehörigen Tätigkeitsklassen steht eine sowohl quantitativ als auch qualitativ sehr gute Datenbasis zur Verfügung.
Aber nicht nur eine gute Datenbasis ist von großer Bedeutung, auch die Aufbereitung der Daten zur Extraktion relevanter Merkmale ist ein wesentlicher Bestandteil der Modellentwicklung. Sprache ist ein komplexes Konstrukt, und anhand der Regeln für die Sprachbildung (Syntax), der Bedeutung der Wörter und ihrer Anordnung (Semantik), aber auch der Verwendung spezieller Konstruktionen in bestimmten Situationen (Pragmatik) können verschiedene Merkmale extrahiert werden. So können z.B. über Wortarten Informationen über Texte gesammelt werden. Tätigkeiten werden durch Verben beschrieben, aber auch Substantive können indirekt eine Tätigkeit beschreiben. So kann z.B. eine „Grundierung“ aufgetragen oder eine Wand „grundiert“ werden. Beides beschreibt die Tätigkeit Grundieren. Wörter können sich durch Konjugation oder Deklination verändern. Um dennoch eine Vielzahl verwandter Begriffe zu erkennen, werden die Wörter oft mit Hilfe einer Datenbank oder spezieller Regeln auf ihren Wortstamm reduziert. Aber auch beschreibende Merkmale aus der Statistik wie die Anzahl der Wörter, Sätze oder Substantive in einem Text können als mögliche Klassifikationsmerkmale herangezogen werden. In Abbildung 1 ist die Anzahl der Wortarten Substantiv und Verb für verschiedene Aufträge aufgetragen. Dazu wurde ein sogenannter Boxplot verwendet. Dieser zeigt den Median (schwarzer horizontaler Balken), die Quartile (farblich hervorgehobener Bereich) und die Werte, die im Bereich des 1,5-fachen Quartils liegen (vertikale Balken). Die Punkte im Diagramm stellen Ausreißer dar.
Boxplots sind eine beliebte Visualisierungsform, um die Verteilung von Daten darzustellen. Beispielsweise weisen die Wortarten in den Aufträgen eine andere Verteilung auf als in klassischen Zeitungen oder anderen Medienbeiträgen. Dies erschwerte die Modellsuche, da vortrainierte Modelle, die auf die Analyse solcher klassischen Texte ausgelegt sind, nur unzureichende Ergebnisse lieferten.
Daher wurde für die Weiterverarbeitung der Texte das sogenannte Word Embedding verwendet. Hierbei werden die Wörter der Texte als reelle Vektoren dargestellt. Dies dient der Dimensionsreduktion und der besseren Verarbeitung in verschiedenen Modellansätzen. Dabei können die Vektoren durch verschiedene Methoden erzeugt werden. Wie bereits erläutert, sind aufgrund der von klassischen Texten abweichenden Struktur der Ausschreibungstexte vortrainierte NLP-Algorithmen nicht geeignet. Somit musste ein neuer eigener Modellansatz entwickelt werden.
Quelle: © Ki-generiert auf Adobe Firefly
Der aktuelle Stand der Technik verwendet häufig rekurrente neuronale Netze, um Wissen aus Texten zu extrahieren. Diese benötigen jedoch eine sehr große Anzahl von Trainingsbeispielen. Erste Trainings dieser Modellansätze zeigten keine positiven Ergebnisse, so dass ein neuer Ansatz entwickelt werden musste. Im Bereich des maschinellen Lernens, einem Teilgebiet der künstlichen Intelligenz, sind Entscheidungsbäume ein häufig verwendetes Modell. Eine Abwandlung davon sind Random Forest Algorithmen, die eine Vielzahl von Entscheidungsbäumen bilden und so eine noch bessere Klassifikation ermöglichen. Der Vorteil von Entscheidungsbäumen ist zum einen, dass eine kleinere Trainingsmenge ausreicht und zum anderen, dass die Modelle sehr gut erklärbar sind, da die Regeln zur Klassifikation aus den Bäumen abgeleitet werden können. Daher wurde mit Hilfe eines Random Forest Modells ein funktionierendes und trainierbares Modell für die Klassifikation von Ausschreibungstexten zu Tätigkeiten gefunden.
Aufgrund der Tatsache, dass einem Ausschreibungstext mehrere Tätigkeitsklassen zugeordnet werden können, musste ein Multi-Klassifikator verwendet werden. Dazu wurde für jede Tätigkeit ein Modell entwickelt und die Ergebnisse der einzelnen Modelle aggregiert. Dies führt einerseits zu einer höheren Genauigkeit der Klassifikation und ermöglicht andererseits eine einfache Erweiterung der Modelle für weitere Tätigkeiten oder die Übertragung auf andere Gewerke.
Mit einer mittleren Genauigkeit von ca. 78 % und einer mittleren Sensitivität von 72 % (Abbildung 2) über alle Klassen bietet das entwickelte Modell eine ausreichende Genauigkeit für den Einsatz in der teilautomatisierten Auftragsabwicklung im Bereich der Ausschreibungsbearbeitung. Zusätzlich wurde eine explizite Validierungslogik in das System implementiert, um die Qualität der Modelle kontinuierlich zu bestimmen. Denn auch nach dem ersten Training kann das Modell durch die Bereitstellung neuer Trainingsbeispiele weiter verfeinert und an neue Problemstellungen angepasst bzw. nachtrainiert werden.
Es zeigt sich also, dass künstliche Intelligenz auch im Handwerk Einzug gehalten hat und bei unliebsamen Aufgaben im Tagesgeschäft unterstützen kann. Dennoch muss die Digitalisierung im Handwerk weiter fokussiert und kommuniziert werden. Künstliche Intelligenz muss entmystifiziert werden, um neue Anwendungsfälle zu erschließen. Der hier vorgestellte Demonstrator soll dazu einen Beitrag leisten und Interessierte auf neue Ideen bringen.
KI steht also keineswegs im Widerspruch zu Anwendungen im Handwerk, auch wenn die Anwendungsbereiche derzeit noch sehr begrenzt sind. Dennoch wird auch das Handwerk von den Vorteilen profitieren und es werden neue Modelle entstehen.
Sollten Sie Fragen oder Anregungen zu dem Thema haben, sprechen Sie uns gerne an:
Ansprechpartner:
Maximilian Rohe
KI-Trainer Modellfabrik Vernetzung
Telefon: 03677/69-3856
E-Mail: rohe@kompetenzzentrum-ilmenau.de
Bildquellen
- Steinmetzarbeiten: © Frauke Riether - Pixabay
- Firefly Künstliche Intelligenz und Handwerk 2246: © Ki-generiert auf Adobe Firefly
- Werkstatt: © Clark Young - Unsplash