Föderierte KI-Lösung zur
Verarbeitung komplexer Dokumente
Projektziele
Effiziente Nutzung von KI in KMU durch:
verbessertes Training von KI-Modellen unter Wahrung der Datenhoheit, ausreichende Trainingsdaten sowie erweitertes KI Know-How
Jedes Jahr werden immer noch Milliarden von Dokumenten aufwändig manuell verarbeitet, wie z.B. in der Schadenabwicklung bei Versicherungen. Nachdem diese bisher aufgrund der großen Bandbreite von Dokumentenlayouts und (Scan-) Qualität nur bedingt mit Standardmethoden zur Texterkennung und -interpretation analysiert werden konnten, ermöglichen die neu aufkommenden KI-Verfahren zur Dokumenterkennung nun eine automatische Verarbeitung.
Bei kleineren Organisationen wie KMUs scheitert deren Einsatz jedoch noch daran, dass zum Training der KI-Modelle umfangreiche Datenmengen benötigt werden. Eine gemeinsame Entwicklung der Modelle durch verschiedene Unternehmen ist dabei kaum möglich, weil sie die Datenhoheit der Beteiligten verletzen würde. Weiterhin fehlt vielen Organisationen noch das Know-How, um KI-Modelle selbst zu trainieren und einzusetzen.
FedXtract schafft die technologische Grundlage für KMU zum föderierten Training von KI-Modellen
FedXtract adressiert all diese Herausforderungen und schafft eine Lösung, mit deren Hilfe Organisationen ohne komplexes KI Know-How in die Lage versetzt werden, gemeinsam unter Wahrung der Datenhoheit KI-Modelle zu trainieren und das gemeinsame Modell auf den individuellen Anwendungsfall anzupassen. In dieser Lösung wird mittels sog. Föderierten Lernens (FL) eine unternehmensübergreifende, kontinuierliche Verbesserung eines globalen KI-Modells durch mehrere, verteilte Anwender ermöglicht. Dabei werden lediglich die inkrementellen Verbesserungen der Modelle ausgetauscht, so dass die sensiblen Daten lokal bleiben. Jeder Anwender kann dann in einem anschließenden Schritt ein User-spezifisches KI-Modell entwickeln, indem das globale, gemeinsame Modell über sog. Transfer Learning (TL) für den eigenen Anwendungsfall optimiert wird.
Abbildung: Kontinuierliche, unternehmensübergreifende Verbesserung eines KI-Modells durch Föderiertes Lernen und Optimierung auf individuelle Anwendungen durch Transfer Learning
Erreicht wird dies durch die Entwicklung eines neuen containerbasierten Open-Source Software Development Kits (SDK) mit dessen Hilfe datenschutzkonform, ohne komplexes Data Science-Know-How und mit geringen Datenmengen KI-Modelle trainiert werden können. Zur Demonstration der Umsetzung des FedXtract SDKs dient als erster Anwendungsfall die KI-basierte Extraktion von Informationen aus komplexen Dokumenten der Industrie.
FedXtract senkt die Eintrittshürden zur Nutzung der neuen KI-Technologien durch ein Freemium Modell mit der Bereitstellung des FedXtract SDK als Open Source. Kleinere Unternehmen wie KMUs können so anhand einer Best Practice zusammen mit anderen Organisationen KI-Modelle für ihren Bedarf trainieren. Die Konsortial-Partner bieten dazu Beratung und Premium-Funktionen für die Industrie, Medien, Healthcare und den öffentlichen Dienst an.
Projektpartner
condat AG
Als erfahrener Partner begleiten wir unsere Kunden vor allem aus den Bereichen Medien und Healthcare bei der nachhaltigen Digitalisierung ihrer Geschäftsprozesse. Medienunternehmen unterstützen wir mit unserer KI-basierten Content Discovery-Lösung Smart Media Engine bei der besseren Nutzung und Verwertung von Daten und Inhalten. Mit individuell konzipierten Portalanwendungen auf der Basis marktführender Content Management- Systeme spielen unsere Kunden mit höchster Zuverlässigkeit multimedialen Content aus und betreiben leistungsfähige Intranetservices. In Krankenhäusern und Pflegeeinrichtungen digitalisieren wir mit unserer modularen Lösungsplattform Smart Health Solution zentrale Kommunikations- und Interaktionsprozesse und setzen integrierte Klinikanwendungen wie Mitarbeiterportale und Bewerbermanagementsysteme um.
Ein wesentliches Geschäftsfeld der Condat ist die Entwicklung von Systemen unter Einsatz von KI-Technologien einschließlich ML/DL zur Analyse und Verarbeitung von Text, Bild und Video sowie den dazugehörigen Metadaten. Die in FuE Projekten (z.B. LinkedTV, InVID, Qurator, Panqura) entstandenen Lösungen werden bei Kunden wie rbb, ZDF, ARD digital, mdr, GVL und LFM (Landesanstalt für Medien NRW) im realen Betrieb eingesetzt. Die Condat deckt den vollständigen Plan-Build-Run Cycle ab. Wir verfügen aus einer Vielzahl von FuE- und Kundenprojekten über Expertenwissen in den Bereichen automatische Analyse von Text, Bild und Video. Zudem bringt Condat gelabelte Dokumentdaten wie Formulare, Rechnungen, sowie Screenshots aus realen Prozessen in den Bereichen Medien/TV und Healthcare in FedXtract ein, die zur Validierung der im Projekt entwickelten Verfahren genutzt werden können.
Fraunhofer IAIS
Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS ist eines von derzeit 76 Instituten der Fraunhofer-Gesellschaft. Als eines der führenden Wissenschaftsinstitute auf den Gebieten Künstliche Intelligenz, Maschinelles Lernen und Big Data in Deutschland und Europa erforschen und entwickeln die mehr als 300 Wissenschaftlerinnen und Wissenschaftler des Fraunhofer IAIS innovative Systeme, um Daten zu analysieren und Informationen zu erschließen. Unter der Leitung von Prof. Dr. Wrobel, der von der Gesellschaft für Informatik als einer der zehn prägenden Köpfen der KI in Deutschland ausgezeichnet wurde, hat das Institut in 2019 eine weitreichende Untersuchung zu Nutzung und Potenzial von Big Data und KI durchgeführt. Ziel war es, das Thema stärker in der deutschen Wirtschaft zu etablieren.
Das Fraunhofer IAIS erforscht und entwickelt unter anderem innovative Systeme, um Daten zu analysieren und Informationen aus Dokumenten zu erschließen. Die Abteilung NetMedia fokussiert sich etwa auf die KI-gestützte OCR und Dokumentenanalyse: In dem KMU-Innovativ-Projekt DeepER wurde eine auf Deep-Learning-Verfahren basierende schnelle und robuste OCR-Engine entwickelt, die auch bei qualitativ schlechteren Dokumenten eine sehr gute Erkennungsrate erzielt. Weiterhin wird für die Erkennung und Auswertung von Tabellen mit Transformer-Architekturen gearbeitet.
Das Fraunhofer IAIS verfügt bereits über umfangreiche Erfahrungen im Erkennen von Entitäten auf Basis von neuronalen Netzwerken. Durch die Nutzung von Informationen über das räumliche Arrangement von Entitäten auf einem Dokument, wie sie hier im Projekt erforscht werden soll, sollte die Robustheit des Systems und die Qualität der Ergebnisse nochmals deutlich gesteigert werden können.
Darüber hinaus steht das Fraunhofer IAIS im Zentrum eines starken Forschungsnetzwerks. Seit 2014 koordiniert es als geschäftsführendes Institut die Fraunhofer-Allianz Big Data und Künstliche Intelligenz, welche die branchenübergreifende Expertise von über 30 Fraunhofer-Instituten in Big Data und Künstlicher Intelligenz bündelt. Es ist ferner ein wichtiger Treiber der Initiative zum International Data Space mit dem Ziel, einen sicheren Datenraum zu schaffen, der Unternehmen verschiedener Branchen und aller Größen die souveräne Bewirtschaftung ihrer Datengüter ermöglicht. Daneben bestehen langjährige enge Kooperationen in Forschung und Lehre mit der Exzellenz-Universität Bonn und dem »Bonn-Aachen International Center for Information Technology« (b-it).
Im Jahr 2018 hat das Fraunhofer IAIS sein strategisches Netzwerk weiter ausgebaut und ist auf Landes-, Bundes-, und EU-Ebene in führender Rolle an wichtigen Initiativen beteiligt. So leitet das Fraunhofer IAIS die Geschäftsstelle der Kompetenzplattform KI.NRW und ist gemeinsam mit der TU Dortmund führender Partner beim Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz – das neue Spitzenforschungsinstitut ist eines von fünf universitären KI-Kompetenzzentren bundesweit, die seit Sommer als Teil der KI-Strategie der Bundesregierung dauerhaft gefördert werden.
Control€xpert
ControlExpert (CE) digitalisiert manuelle Prozesse entlang des End-2-End-Schadenmanagements zur effizienten Abwicklung von KFZ-Schaden- und Wartungsvorgängen – und hat damit eine Branche revolutioniert. Das im Jahr 2002 gegründete High-Tech-Unternehmen gilt als der deutsche Digitalisierungsexperte auf diesem Gebiet und arbeitet weltweit an 17 Standorten mit mehr als 130 Versicherern, Autohäusern, Werkstätten, Leasinggesellschaften und Automobilherstellern zusammen. Weltweit sind 800 Mitarbeiter für CE tätig, darunter 350 KFZ-Meister, über 100 IT-Experten, 10 Datenmanager und über 30 Experten für Forschung & Entwicklung.
Als Vorreiter der Automatisierung und Digitalisierung erleichtert CE mit seinen Produkten und Services die Kommunikation zwischen den am Schadenprozess beteiligten Parteien, wie Fahrzeughalter, Automobilhersteller, Leasingfirmen, Flottenbetreiber, Autohäuser, Werkstätten und Versicherungsunternehmen. Das ermöglicht eine kosten- und zeiteffiziente Schadenabwicklung mit jährlich über 14 Millionen Schadensfällen. Mit Hilfe der einzigartigen Kombination aus KFZ-Sachverstand, Algorithmen, Datenanalysen und KI lassen sich wichtige Prozesspunkte im End-2-End-Schadenmanagement zuverlässig beurteilen, so zum Beispiel das Ausmaß von Unfallschäden und die damit verbundenen Reparaturkosten.
In der 2015 gegründeten Forschungs- und Entwicklungsabteilung von CE beschäftigen sich über 30 KI-Experten unter anderem mit der Entwicklung neuronaler Netze zur Schadenanalyse auf Bildern und Videos, zur automatisierten Erfassung von Dokumenten und deren Verständnis, mit dem Ziel das Kfz-Schadenmanagement zu beschleunigen. Die Zuverlässigkeit der KI-Modelle wurde dabei über die Jahre auf ein so hohes Niveau gebracht, dass diese heute Anwendung im Live-Betrieb zahlreicher Produkte finden.
Ca. 38.000 KFZ-Schadenvorgänge werden von CE pro Tag geprüft. Um eine solche Menge effizient bearbeiten zu können, werden die Schadenvorgänge in ein einheitliches Format überführt. Dazu werden die Informationen zunächst auf dem Dokument lokalisiert (Bounding Box Label) und anschließend in einem strukturierten Datensatz abgelegt (Label für Informationsart und –wert, z. B. Rechnungsdatum: 01.01.2020). CE verfügt so über eine große Menge an schon vorgelabelten Datensätzen, die unter Einhaltung des Datenschutzes für das Training eingesetzt werden können.
Das Projekt-Team des FedXtract-Konsortiums