FedXtract
Foderierte KI-Losung zur Verarbeitung komplexer Dokumente
Über uns
Herausforderungen für die Nutzung von KI in KMU: Training von KI-Modellen unter Wahrung der Datenhoheit, nicht ausreichende Trainingsdaten sowie fehlendes KI Know-How
Jedes Jahr werden immer noch Milliarden von Dokumenten aufwändig manuell verarbeitet, wie z.B. in der Schadenabwicklung bei Versicherungen. Nachdem diese bisher aufgrund der großen Bandbreite von Dokumentenlayouts und (Scan-) Qualität nur bedingt mit Standardmethoden zur Texterkennung und -interpretation analysiert werden konnten, ermöglichen die neu aufkommenden KI-Verfahren zur Dokumenterkennung nun eine automatische Verarbeitung. Bei kleineren Organisationen wie KMUs scheitert deren Einsatz jedoch noch daran, dass zum Training der KI-Modelle umfangreiche Datenmengen benötigt werden. Eine gemeinsame Entwicklung der Modelle durch verschiedene Unternehmen ist dabei kaum möglich, weil sie die Datenhoheit der Beteiligten verletzen würde. Weiterhin fehlt vielen Organisationen noch das Know-How, um KI-Modelle selbst zu trainieren und einzusetzen.
FedXtract schafft die technologische Grundlage für KMU zum föderierten Training von KI-Modellen
FedXtract adressiert all diese Herausforderungen und schafft eine Lösung, mit deren Hilfe Organisationen ohne komplexes KI Know-How in die Lage versetzt werden, gemeinsam unter Wahrung der Datenhoheit KI-Modelle zu trainieren und das gemeinsame Modell auf den individuellen Anwendungsfall anzupassen. In dieser Lösung wird mittels sog. Föderierten Lernens (FL) eine unternehmensübergreifende, kontinuierliche Verbesserung eines globalen KI-Modells durch mehrere, verteilte Anwender ermöglicht. Dabei werden lediglich die inkrementellen Verbesserungen der Modelle ausgetauscht, so dass die sensiblen Daten lokal bleiben. Jeder Anwender kann dann in einem anschließenden Schritt ein User-spezifisches KI-Modell entwickeln, indem das globale, gemeinsame Modell über sog. Transfer Learning (TL) für den eigenen Anwendungsfall optimiert wird.
Abbildung: Kontinuierliche, unternehmensübergreifende Verbesserung eines KI-Modells durch Föderiertes Lernen und Optimierung auf individuelle Anwendungen durch Transfer Learning
Erreicht wird dies durch die Entwicklung eines neuen containerbasierten Open-Source Software Development Kits (SDK) mit dessen Hilfe datenschutzkonform, ohne komplexes Data Science-Know-How und mit geringen Datenmengen KI-Modelle trainiert werden können. Zur Demonstration der Umsetzung des FedXtract SDKs dient als erster Anwendungsfall die KI-basierte Extraktion von Informationen aus komplexen Dokumenten der Industrie.
FedXtract senkt die Eintrittshürden zur Nutzung der neuen KI-Technologien durch ein Freemium Modell mit der Bereitstellung des FedXtract SDK als
Open Source. Kleinere Unternehmen wie KMUs können so anhand einer Best Practice zusammen mit anderen Organisationen KI-Modelle für ihren Bedarf
trainieren. Die Konsortial-Partner bieten dazu Beratung und Premium-Funktionen für die Industrie, Medien, Healthcare und den öffentlichen Dienst an.
Projektpartner
Condat AG
Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS
Control€xpert GmbH
Sed porttitor lectus nibh. Curabitur aliquet quam id dui posuere blandit. Quisque velit nisi, pretium ut lacinia in, elementum id enim. Quisque velit nisi, pretium ut lacinia in, elementum id enim. Curabitur non nulla sit amet nisl tempus convallis quis