Seite wählen

Föderierte KI-Lösung zur
Verarbeitung komplexer Dokumente

Projektziele

Effiziente Nutzung von KI in KMU durch:
verbessertes Training von KI-Modellen unter Wahrung der Datenhoheit, ausreichende Trainingsdaten sowie erweitertes KI Know-How

Jedes Jahr werden immer noch Milliarden von Dokumenten aufwändig manuell verarbeitet, wie z.B. in der Schadenabwicklung bei Versicherungen. Nachdem diese bisher aufgrund der großen Bandbreite von Dokumentenlayouts und (Scan-) Qualität nur bedingt mit Standardmethoden zur Texterkennung und -interpretation analysiert werden konnten, ermöglichen die neu aufkommenden KI-Verfahren zur Dokumenterkennung nun eine automatische Verarbeitung.

Bei kleineren Organisationen wie KMUs scheitert deren Einsatz jedoch noch daran, dass zum Training der KI-Modelle umfangreiche Datenmengen benötigt werden. Eine gemeinsame Entwicklung der Modelle durch verschiedene Unternehmen ist dabei kaum möglich, weil sie die Datenhoheit der Beteiligten verletzen würde. Weiterhin fehlt vielen Organisationen noch das Know-How, um KI-Modelle selbst zu trainieren und einzusetzen.

FedXtract schafft die technologische Grundlage für KMU zum föderierten Training von KI-Modellen

FedXtract adressiert all diese Herausforderungen und schafft eine Lösung, mit deren Hilfe Organisationen ohne komplexes KI Know-How in die Lage versetzt werden, gemeinsam unter Wahrung der Datenhoheit KI-Modelle zu trainieren und das gemeinsame Modell auf den individuellen Anwendungsfall anzupassen. In dieser Lösung wird mittels sog. Föderierten Lernens (FL) eine unternehmensübergreifende, kontinuierliche Verbesserung eines globalen KI-Modells durch mehrere, verteilte Anwender ermöglicht. Dabei werden lediglich die inkrementellen Verbesserungen der Modelle ausgetauscht, so dass die sensiblen Daten lokal bleiben. Jeder Anwender kann dann in einem anschließenden Schritt ein User-spezifisches KI-Modell entwickeln, indem das globale, gemeinsame Modell über sog. Transfer Learning (TL) für den eigenen Anwendungsfall optimiert wird.

Abbildung: Kontinuierliche, unternehmensübergreifende Verbesserung eines KI-Modells durch Föderiertes Lernen und Optimierung auf individuelle Anwendungen durch Transfer Learning

Erreicht wird dies durch die Entwicklung eines neuen containerbasierten Open-Source Software Development Kits (SDK) mit dessen Hilfe datenschutzkonform, ohne komplexes Data Science-Know-How und mit geringen Datenmengen KI-Modelle trainiert werden können. Zur Demonstration der Umsetzung des FedXtract SDKs dient als erster Anwendungsfall die KI-basierte Extraktion von Informationen aus komplexen Dokumenten der Industrie.

FedXtract senkt die Eintrittshürden zur Nutzung der neuen KI-Technologien durch ein Freemium Modell mit der Bereitstellung des FedXtract SDK als Open Source. Kleinere Unternehmen wie KMUs können so anhand einer Best Practice zusammen mit anderen Organisationen KI-Modelle für ihren Bedarf trainieren. Die Konsortial-Partner bieten dazu Beratung und Premium-Funktionen für die Industrie, Medien, Healthcare und den öffentlichen Dienst an.

Projektpartner

condat AG

Als erfahrener Partner begleiten wir unsere Kunden vor allem aus den Bereichen Medien und Healthcare bei der nachhaltigen Digitalisierung ihrer Geschäftsprozesse. Medienunternehmen unterstützen wir mit unserer KI-basierten Content Discovery-Lösung Smart Media Engine bei der besseren Nutzung und Verwertung von Daten und Inhalten. Mit individuell konzipierten Portalanwendungen auf der Basis marktführender Content Management- Systeme spielen unsere Kunden mit höchster Zuverlässigkeit multimedialen Content aus und betreiben leistungsfähige Intranetservices. In Krankenhäusern und Pflegeeinrichtungen digitalisieren wir mit unserer modularen Lösungsplattform Smart Health Solution zentrale Kommunikations- und Interaktionsprozesse und setzen integrierte Klinikanwendungen wie Mitarbeiterportale und Bewerbermanagementsysteme um.

Ein wesentliches Geschäftsfeld der Condat ist die Entwicklung von Systemen unter Einsatz von KI-Technologien einschließlich ML/DL zur Analyse und Verarbeitung von Text, Bild und Video sowie den dazugehörigen Metadaten. Die in FuE Projekten (z.B. LinkedTV, InVID, Qurator, Panqura) entstandenen Lösungen werden bei Kunden wie rbb, ZDF, ARD digital, mdr, GVL und LFM (Landesanstalt für Medien NRW) im realen Betrieb eingesetzt. Die Condat deckt den vollständigen Plan-Build-Run Cycle ab. Wir verfügen aus einer Vielzahl von FuE- und Kundenprojekten über Expertenwissen in den Bereichen automatische Analyse von Text, Bild und Video. Zudem bringt Condat gelabelte Dokumentdaten wie Formulare, Rechnungen, sowie Screenshots aus realen Prozessen in den Bereichen Medien/TV und Healthcare in FedXtract ein, die zur Validierung der im Projekt entwickelten Verfahren genutzt werden können.

Fraunhofer IAIS

Das IAIS ist eines der 70 Institute der Fraunhofer-Gesellschaft und erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen zu erschließen. Damit ist der effiziente Umgang mit Big Data für das Fraunhofer IAIS von hoher strategischer Bedeutung: Unter der Leitung von Prof. Dr. Wrobel, einem von zehn prägenden Köpfen der KI in Deutschland, hat das Institut in 2019 eine weitreichende Untersuchung zu Nutzung und Potenzial von Big Data und KI durchgeführt. Ziel war es, das Thema stärker in der deutschen Wirtschaft zu etablieren. Inzwischen hat das Institut nicht nur erfolgreich verschiedene Big-Data- und KI-Projekte umgesetzt, sondern koordiniert die Fraunhofer-Allianz Big Data, ist federführend im Industrial Data Space tätig und leitet eines der BMBF-geförderten Machine-Learning-Zentren in Deutschland. Die Abteilung NetMedia fokussiert sich unter anderem auf die KI-gestützte OCR und Dokumentenanalyse.

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen aus Dokumenten zu erschließen [Fraunhofer, 2020]. So wurde in dem kürzlich abgeschlossenen KMU-Innovativ-Projekt DeepER eine auf Deep-Learning-Verfahren basierende schnelle und robuste OCR-Engine entwickelt, die auch bei qualitativ schlechteren Dokumenten eine sehr gute Erkennungsrate erzielt. Weiterhin wird für die Erkennung und Auswertung von Tabellen mit Transformer-Architekturen gearbeitet.

Fraunhofer IAIS verfügen bereits über umfangreiche Erfahrungen im Erkennen von Entitäten auf Basis von neuronalen Netzwerken. Durch die Nutzung von Informationen über das räumliche Arrangement von Entitäten auf einem Dokument wie sie hier im Projekt erforscht werden soll, sollte die Robustheit des Systems und die Qualität der Ergebnisse nochmals deutlich gesteigert werden können.

Control€xpert

ControlExpert (CE) digitalisiert manuelle Prozesse entlang des End-2-End-Schadenmanagements zur effizienten Abwicklung von KFZ-Schaden- und Wartungsvorgängen – und hat damit eine Branche revolutioniert. Das im Jahr 2002 gegründete High-Tech-Unternehmen gilt als der deutsche Digitalisierungsexperte auf diesem Gebiet und arbeitet weltweit an 17 Standorten mit mehr als 130 Versicherern, Autohäusern, Werkstätten, Leasinggesellschaften und Automobilherstellern zusammen. Weltweit sind 800 Mitarbeiter für CE tätig, darunter 350 KFZ-Meister, über 100 IT-Experten, 10 Datenmanager und über 30 Experten für Forschung & Entwicklung.

Als Vorreiter der Automatisierung und Digitalisierung erleichtert CE mit seinen Produkten und Services die Kommunikation zwischen den am Schadenprozess beteiligten Parteien, wie Fahrzeughalter, Automobilhersteller, Leasingfirmen, Flottenbetreiber, Autohäuser, Werkstätten und Versicherungsunternehmen. Das ermöglicht eine kosten- und zeiteffiziente Schadenabwicklung mit jährlich über 14 Millionen Schadensfällen. Mit Hilfe der einzigartigen Kombination aus KFZ-Sachverstand, Algorithmen, Datenanalysen und KI lassen sich wichtige Prozesspunkte im End-2-End-Schadenmanagement zuverlässig beurteilen, so zum Beispiel das Ausmaß von Unfallschäden und die damit verbundenen Reparaturkosten.

In der 2015 gegründeten Forschungs- und Entwicklungsabteilung von CE beschäftigen sich über 30 KI-Experten unter anderem mit der Entwicklung neuronaler Netze zur Schadenanalyse auf Bildern und Videos, zur automatisierten Erfassung von Dokumenten und deren Verständnis, mit dem Ziel das Kfz-Schadenmanagement zu beschleunigen. Die Zuverlässigkeit der KI-Modelle wurde dabei über die Jahre auf ein so hohes Niveau gebracht, dass diese heute Anwendung im Live-Betrieb zahlreicher Produkte finden.

Ca. 38.000 KFZ-Schadenvorgänge werden von CE pro Tag geprüft. Um eine solche Menge effizient bearbeiten zu können, werden die Schadenvorgänge in ein einheitliches Format überführt. Dazu werden die Informationen zunächst auf dem Dokument lokalisiert (Bounding Box Label) und anschließend in einem strukturierten Datensatz abgelegt (Label für Informationsart und –wert, z. B. Rechnungsdatum: 01.01.2020). CE verfügt so über eine große Menge an schon vorgelabelten Datensätzen, die unter Einhaltung des Datenschutzes für das Training eingesetzt werden können.