top of page

Automatische PDF-Digitalisierung

400% Return on Investment durch KI   |   Ein Fallbeispiel

FIXTEST ist ein mittelständisches Unternehmen, das sich auf die Herstellung von Kontaktstiften spezialisiert hat. Diese essentiellen elektrischen Kontaktteile werden hauptsächlich in Steckverbindern verwendet und sind entscheidend für die Verbindung elektronischer Komponenten in vielen Industrien wie der Automobiltechnik, Raumfahrt und Medizintechnik.

Präzisionsgefertigte Kontaktstifte von FIXTEST, verwendet in Steckverbindern für die Automobil-, Luftfahrt- und Medizintechnik, zeigen hochwertige Fertigung.

Aufgrund der breiten Anwendbarkeit und der Vielfalt an Anforderungen, die verschiedene Industrien stellen, hat FIXTEST ein umfangreiches Portfolio entwickelt. Das Unternehmen bietet Tausende von Ausführungen an Kontaktstiften an, die alle in einem ausführlichen Produktkatalog dokumentiert sind.

Motivation

FIXTEST stand vor der Herausforderung, seine umfangreiche Produktdatenbank zu modernisieren. Die bisherige Nutzung unstrukturierter PDF-Dateien als alleinige Informationsquelle für die technischen Daten ihrer Produkte erwies sich als zunehmend ineffizient und unzureichend.

 

Um eine bessere Übersicht über ihr Produktangebot zu gewährleisten und den Kunden bei Bedarf technische Metadaten zusammen mit CAD-Daten automatisch zur Verfügung zu stellen, war es notwendig, diese Daten in einem Produkt-Datenmanagement-System (PDM) zu erfassen. Dieser Schritt war für FIXTEST eine Investition, um schneller auf Marktanforderungen zu reagieren und gleichzeitig den Kundenservice zu verbessern. Das Unternehmen hatte bereits damit begonnen, die Produkt-PDFs händisch zu digitalisieren, der Aufwand dafür war auf ein Personenjahr geschätzt.

Unstrukturierte PDFs: Ein gängiges Szenario

Konkret bedeutete dies, dass ein Mitarbeiter manuell die PDFs öffnete, die darin enthaltenen Werte las und diese anschließend in das Produkt-Datenmanagement-System (PDM) von FIXTEST eingab. Diese Aufgabe war nicht nur mühsam, sondern erforderte auch Fachkenntnisse, da die PDFs technische Daten enthalten, die Laien nicht unbedingt verstehen können. Die Informationen in den PDFs waren historisch gewachsen und variierten von Dokument zu Dokument. Dadurch ergaben sich die typischen Probleme, die so häufig zum Scheitern klassischer Automatisierungen führen:

  • Lückenhafte oder zusätzliche Informationen

  • Uneinheitliche und unübersichtliche Tabellenstrukturen

  • Keine einheitliche Benennung für gleiche Inhalte; Verwendung von Synonymen oder ähnlichen Begriffen

  • Unterschiedliche Maßeinheiten und gelegentliche Tippfehler

Screenshot eines unstrukturierten PDFs von FIXTEST mit detaillierten technischen Daten und Diagrammen von Kontaktstiften vor der KI-gesteuerten Digitalisierung.

Diese Situation ist typisch für KMUs, die häufig über reiche, aber schlecht strukturierte Datenschätze verfügen. Mit herkömmlicher Software ist es extrem schwierig, solche Prozess zu automatisieren. Dazu müsste man nämlich präzise Regeln definieren, wo und wie spezifische Daten in den unstrukturierten PDFs zu finden sind – eine Herausforderung, die praktisch nicht umsetzbar ist. Daher musste diese Aufgabe vorerst manuell von einem qualifizierten Mitarbeiter ausgeführt werden, was - wie bereits erwähnt - etwa ein volles Personenjahr gekostet hätte.

Unsere Lösung: KI zur Digitalisierung

Um die PDF-Digitalisierung zu automatisieren, entwickelten wir eine passgenaue KI-Lösung basierend auf OpenAIs GPT-Technologie. Dazu haben wir in einem iterativen Vorgehen einen maßgeschneiderten Prompt entworfen, der in der Lage ist, die vielfältigen PDF-Dokumente korrekt in ein strukturiertes Format umzuwandeln. Unsere KI erkennt nicht nur verschiedene technische Begriffe und Synonyme, sondern versteht auch die häufigen Inkonsistenzen in der Darstellung von technischen Merkmalen.

Ein weiterer wesentlicher Bestandteil unserer Lösung war das Design eines spezifischen Ausgabeformats für die Daten. Dieses Format definierte die erforderlichen Merkmale, optionale Felder, bevorzugte Einheiten und Spannen sowie bedingte Beziehungen zwischen den Merkmalen. Zusätzlich implementierten wir eine Validierungsschicht, die die Ausgaben des GPT-Modells überprüfte, um die Einhaltung des definierten Datenformats zu gewährleisten.

Prozess und Komponenten der Lösung

Flussdiagramm, das den KI-gesteuerten Prozess der Extraktion und Strukturierung von Daten aus unstrukturierten PDFs in ein Produkt-Datenmanagement-System zeigt, mit Schritten von der PDF-Extraktion bis zur Datenvalidierung.

Unser System besteht aus mehreren Hauptkomponenten, wie im obigen Diagramm dargestellt:
 

  • Textextraktion: Zunächst wird der gesamte Text aus den PDFs mit traditioneller Software extrahiert. Dieser Text ist unstrukturiert und fehlerbehaftet.

  • KI-gesteuerte Datenextraktion: Anschließend kombinieren wir den extrahierten Text mit sorgfältig entworfenen Prompts für die KI. Diese Anweisungen erklären genau, welche Informationen von Interesse sind und wie diese aus dem rohen PDF-Text im gewünschten Format extrahiert werden sollen.

  • Validierung der KI-Ausgaben: Die Ausgaben des KI-Modells werden überprüft, um sicherzustellen, dass sie der vorgegebenen Datenstruktur entsprechen.

  • Datenimport ins PDM: Nach erfolgreicher Validierung können die strukturierten Daten direkt in das Produkt-Datenmanagement-System von FIXTEST importiert werden.

  • Vergleich und Korrektur: Die Richtigkeit der extrahierten Daten wird validiert, indem sie mit bereits manuell eingegebenen Daten im PDM verglichen werden. Hierbei prüfen wir, ob die KI-Daten mit den von Menschen eingegebenen übereinstimmen.

Ergebnisse

  • Effizienz und Zeitersparnis: Durch die KI-gestützte Digitalisierung konnte FIXTEST ein ganzes Personenjahr einsparen. Unsere Lösung übertrug Daten schnell und präzise in das Produkt-Datenmanagement-System, was die Gesamtprojektdauer deutlich verkürzte.

  • Kostenersparnis und ROI: Die Kosten für unsere KI-Lösung lagen deutlich unter denen eines Jahresgehalts für manuelle Dateneingabe, was zu einer Einsparung von etwa 400% führte.

  • Qualitätssteigerung: Die Datenqualität mit KI war höher als  bei der manuellen Bearbeitung, da Tipp- und andere Flüchtigkeitsfehler entfielen. Dies verbesserte die Nutzbarkeit und Zugänglichkeit der Produktdaten für Kunden.

  • Mitarbeiterzufriedenheit: Durch den Ersatz repetitiver Aufgaben durch KI konnte FIXTEST die Arbeitszufriedenheit steigern und so zur Mitarbeiterbindung beitragen, was in einer Zeit des Fachkräftemangels besonders wertvoll ist.

Verteilte Anordnung vergoldeter Kontaktstifte von FIXTEST, wesentlich für elektrische Verbindungen in Steckverbindern verschiedener High-Tech-Industrien.

Sind Sie bereit für Ihren KI-Einstieg?

Wenn Sie auch daran interessiert sind, Ihre Prozesse zu optimieren und ähnliche Ergebnisse in Ihrem Unternehmen zu erzielen, dann warten Sie nicht länger.

bottom of page