Wie KMU von unternehmens­übergreifender Datennutzung profitieren können

Foto: Pixabay/ Gerd Altmann

Wie bereits im Beitrag „Künstliche Intelligenz – Der moderne Hammer für Unternehmen“ erwähnt, haben vor allem KMU Schwierigkeiten von der Anwendung künstlicher Intelligenz (KI) in ihren Geschäftsprozessen zu profitieren. Als eine der größten Herausforderungen bei der Anwendung von KI-gestützten Verfahren, identifizierten Fuchs et al. [1] eine mangelnde Datenbasis. Gerade KMU haben erfahrungsgemäß große Probleme eine für KI geeignete Datenbasis zu schaffen.

Dies liegt vor allem an Schwächen bei der Datenmenge, der Datenqualität und der Informationsbreite der Daten. Um die Informationsbreite zu erhöhen, können Daten aus verschiedenen unternehmenseigenen sowie externen Datenquellen zusammengeführt und aufbereitet werden. Weiterhin kann durch Prozessoptimierung, Mitarbeiterschulung und gezielte Korrekturen die Datenqualität bis zu einem gewissen Maß verbessert werden. Was aber, wenn die unternehmenseigenen, datenproduzierenden Systeme die für eine KI-Anwendung notwendigen Merkmale gar nicht produzieren oder die Datenmenge schlichtweg zu gering ist?

Von diesen Problemen sind vor allem KMU, aber auch größere Unternehmen jedes Digitalisierungsgrades betroffen, weshalb sich in den letzten Jahren mehrere Initiativen, die sich wie die International Data Spaces Association (IDSA) mit der unternehmensübergreifenden Datennutzung beschäftigen, gebildet haben. Ziel dieser Initiativen ist es, Unternehmen Innovationen aus Daten zu ermöglichen, auch wenn diese mit ihrem eigenen Datenbestand dazu nicht in der Lage wären. Innovation entsteht aus Daten in erster Linie dann, wenn Daten verschiedener Datenquellen und Kontexte kombiniert werden [2]. Das beste Beispiel für eine unternehmensübergreifende Datennutzung bietet die Supply-Chain-Optimierung. Um wettbewerbsfähig zu bleiben und die Resilienz gegenüber Krisen zu verbessern, können sich Unternehmen nicht auf ihre eigenen und öffentlich zugängliche Daten verlassen, sondern müssen ihren Datenhorizont erweitern. Durch unternehmensübergreifende Datennutzung bekommen sie Zugriff auf die Daten anderer Unternehmen und können so etwa Teil von hochflexiblen „Supply & Demand“-Netzwerken werden [3].

 

Rahmenbedingungen für Datenaustausch

Damit unternehmensübergreifender Datenaustausch funktionieren kann, müssen Rahmenbedingungen definiert werden, welche es Unternehmen ermöglichen vom Austausch bzw. der unternehmensübergreifenden Datennutzung zu profitieren ohne Gefahr zu laufen, sensible Informationen preiszugeben. Datensouveränität bezeichnet in diesem Sinne die Selbstbestimmung von Personen und Organisationen über die Verwendung ihrer Daten. Im Rahmen des Diskurses über  Datensouveränität wurde die Idee von „allianzgetriebenen Datenökosystemen“ hervorgebracht, die auf Plattformen aufbauen. Seit 2015 hat eine weltweite Allianz von Unternehmen und Forschungseinrichtungen, die IDSA, deren Mitglied Fraunhofer ist, eine standardisierte Referenzarchitektur für solche Plattformen erarbeitet und in einem breiten Spektrum von Anwendungsfällen  (z.B. Medizin und Mobilität) evaluiert [4].

Derzeit wird neben der technischen Referenzarchitektur auch ein Rahmenwerk entwickelt, welches eine vertrauenswürdige Infrastruktur, in der die Zertifizierung von Knoten und Akteuren möglich ist, bereitstellt, um eine sichere und souveräne unternehmensübergreifende Datennutzung zu ermöglichen. Eine Schlüsselfunktion jenes Rahmenwerkes besteht darin, die Datensouveränität zu gewährleisten, d.h. den Dateneigentümern wird die volle Kontrolle über ihre Daten und ihre digitalen Identitäten ermöglicht. Dies erfordert die Definition von Datennutzungsbeschränkungen: Es muss festgelegt werden, wer was in welchem Kontext mit den vom Dateneigentümer freigegebenen Daten tun darf [5].

Die EU definiert fünf Leitsätze zur unternehmensübergreifenden Datennutzung [6]:

  • Barrierefreier Zugang zu anonymen, maschinengenerierten Daten
  • Schutz von Investitionen und Assets
  • Schutz von vertraulichen Daten
  • Anreize zum Datenaustausch
  • Minimierung von Lock-in-Effekten

Dass ein unternehmensübergreifender Datenaustausch und dessen Nutzen keine Fiktion ist, beweist das Forschungsprojekt myOffice ML, das vom Land Tirol gefördert wurde und im Rahmen dessen der Softwarehersteller Poool und Fraunhofer Austria KI-Anwendungen durch zusammenführen von Daten mehrerer KMU – auch Pooling genannt – ermöglichten. Die von Poool entwickelte Unternehmenssoftware wird in der Medienbranche unter anderem zur Projektabwicklung verwendet. Ziel des Projektes war die Prognose des Projekterfolges aus historischen Daten. Mittels historischer Daten sollte vorhergesagt werden, ob sich ein neues Projekt wirtschaftlich lohnen wird oder nicht. Im Rahmen des Projekts wurden Daten von sechs KMU (5-50 Mitarbeitende) analysiert, die durch die Nutzung der Unternehmenssoftware angefallen sind. Obwohl die Datenbasis drei Jahre umfasst, macht die geringe Datenmenge je Unternehmen, die durch die niedrige Anzahl abgeschlossener Projekte pro Jahr begründet ist, eine solide Prognose schwierig. Da die Unternehmen aus verschiedenen Unterbranchen der Medienbranche stammen, weisen die Daten teils unterschiedliche Merkmale auf. Ein naives Pooling der Daten der sechs Unternehmen ist für eine Prognose nicht immer zielführend. Im Rahmen des Projektes wurden verschiedene Poolingstrategien (Kombinationen von Daten bestimmter Unternehmen) getestet, mit denen optimale Ergebnisse für jedes Unternehmen erzielt werden können. Hierbei variiert die Poolgröße und -zusammensetzung (Anzahl der Unternehmen pro Strategie), welche zum besten Ergebnis führt. Ohne ein Pooling der Daten wäre eine qualitativ hochwertige Vorhersage des Projekterfolges bei den meisten Unternehmen nicht möglich gewesen. Vor allem Unternehmen mit einer geringen Anzahl an Datenpunkten profitieren vom Datenpooling.  Aber nicht nur bereits bestehende Nutzer der Software können die Projekterfolgsprognose verwenden. Auch neue Nutzer, die noch keine oder nur eine sehr geringe Menge an Daten haben, können auf Basis ihrer Geschäftsprozesse klassifiziert und einer geeigneten Poolingstrategie zugeordnet werden.

Das Zusammenführen von Daten und der daraus generierte Mehrwert zeigt, dass gerade KMU, deren Datenbasis oft zu gering für KI-Anwendungen ist, von unternehmensübergreifender Datennutzung profitieren können.

Um Daten unternehmensübergreifend nutzen zu können, bieten sich Unternehmen verschiedenste Möglichkeiten an. Viele dieser Möglichkeiten sind noch relativ neu, entwickeln sich aber rasant weiter, was auf deren zunehmende Akzeptanz bei Unternehmen zurückzuführen ist. Im Folgenden werden die aktuellen Möglichkeiten kurz erläutert.

 

Datenmarktplätze

Datenmarktplätze sind Plattformen, auf denen Data Provider und Data Consumer zusammenfinden, um Daten zu verkaufen oder zu kaufen. Ein Datenmarktplatz ist für Data Provider ein einfacher Weg Daten einer breiten Masse vorzustellen und zu verkaufen. Data Consumer wiederum, können auf Datenmarktplätzen unkompliziert nach Daten suchen, welche deren Bedürfnisse abdecken und direkt mit Data Provider in Kontakt treten. Ein Datenmarktplatz funktioniert genauso wie jeder andere Onlinehandel. Wichtig ist, dass der Marktplatz selbst keine Daten anbietet, sondern nur Verkäufer und Käufer zusammenbringt. Der Datenaustausch oder die unternehmensübergreifende Datennutzung wird nach Abschluss eines bilateralen Vertrags direkt zwischen den beiden Parteien vorgenommen. Beim Kauf über Datenmarktplätze ist zu beachten, dass die gewünschten Daten auch wirklich die benötigten Informationen (Features) enthalten und statistischen Merkmale erfüllen. Ein besseres Verständnis über angebotene Datensätze kann über Beispieldatensatze gewonnen werden. Ein Datenmarktplatz für rein kommerzielle Daten ist zum Beispiel Datarade ( www.datarade.ai).

 

Datenallianzen

In Datenallianzen schließen sich Unternehmen dann zusammen, wenn ein übergeordnetes Unternehmen als Enabler fungiert und Daten anderer Unternehmen benötigt. Eine klassische Rollenverteilung ist hierbei ein Produzenten-Kundenverhältnis. Der Enabler (Produzent) entwickelt und vertreibt ein Produkt, auf dessen Daten er angewiesen ist, um einen innovativen Service anzubieten, von dem auch jeder einzelne Kunde des Produktes profitiert. Hierfür benötigt er jedoch möglichst viele Daten der Kunden, um eine ausreichende Datenbasis zu haben, was einem 1:n-Abhängigkeitsverhältnis entspricht. Der Datenaustausch zwischen den Akteuren muss nicht über den Enabler laufen, sondern kann auch über andere Plattformen erfolgen.

 

Open Data

Nicht nur kostenpflichtige Daten bieten einen Mehrwert zur Generierung von innovativen Services oder zur Verbesserung von KI-Modellen. Auch öffentlich zugängliche Daten, sogenannte Open Data werden immer öfter verwendet, um bereits bestehende Datensätze um relevante Features zu erweitern. Dadurch lassen sich umfangreiche Datasätze generieren, was oftmals zu besseren Ergebnissen bei KI-Anwendungen führt oder diese erst ermöglicht. Diese Daten dürfen von jedermann zu jedem Zweck genutzt, weiterverbreitet und verwendet werden. Um den Ursprung und die Offenheit der Daten zu sichern, sind durch Nennung des Urhebers oder die Verwendung der „Share alike“-Klausel Nutzungseinschränkungen erlaubt.

 

Data Spaces/Datenökosystem

In Data Spaces (Datenräumen) finden Akteure zusammen, um branchenspezifische und industriesektorale Problemstellungen zu lösen. Durch diese Zusammenschlüsse ist es möglich, Herausforderungen im Bereich der unternehmensübergreifenden Datennutzung konkret und domänenspezifisch zu analysieren und zu bewältigen. Zusammenhängende Datenketten von der Rohstoffgewinnung über Verarbeitungsschritte bis hin zum Endprodukt (Stichwort: „digitaler Produktpass“) ermöglichen vielversprechende Anwendungsfälle wie die exakte Bestimmung eines Produkt-Carbon-Footprints oder die umfassende Wiederverwertung von Produkten und Materialien am Ende von Produktlebenszyklen. Unternehmen können in Data Spaces gleichzeitig als Data Provider und Data Consumer auftreten. Daten werden bilateral zwischen den beteiligten Parteien ausgetauscht, ein Intermediär ist nicht notwendig. Data Spaces basieren auf der Gleichberechtigung aller Akteure. Daten werden unter Wahrung der Datensouveränität für innovative Services nutzbar gemacht. Der sich im Aufbau befindende datahub.tirol ist ein Beispiel, wie Daten regional, national und international genützt und verknüpft werden können um neue Geschäftsmodelle zu entwickeln.

 

Im Rahmen des DIH West unterstützt Fraunhofer Austria Unternehmen bei der Bewältigung unternehmerischer Herausforderungen mithilfe von datenbasierten Ansätzen. Dabei spielt die Nutzung externer Datenquellen eine immer größere Rolle.

Autor

Fabian Lächler

Fabian Lächler

Fraunhofer Innovationszentrum »Digitale Transformation der Industrie«, Fraunhofer Austria Research GmbH
fabian.laechler@fraunhofer.at

Literaturverzeichnis

[1] Fuchs, B.; Schumacher, A.; Eggeling, E.; Schlund, S. (2022): Fraunhofer Austria KI-Studie: Künstliche Intelligenz in Österreichs Unternehmen. Hg. v. Fraunhofer Austria Research GmbH. Online verfügbar unter https://s3.eu-central-1.amazonaws.com/cdn.a3bau.at/public/2022-03/PDF_20220216_OTS0116_0.pdf.

[2] Lauf, Florian; Schneider, Simon; Meister, Sven; Radic, Marija; Herrmann, Philipp; Schulze, Max et al. (2021): Data Sovereignty and Data Economy—Two Repulsive Forces? Hg. v. Fraunhofer Institute for Software and Systems Engineering ISST.

[3] Jarke, Matthias; Otto, Boris; Ram, Sudha (Hg.) (2019): Data Sovereignty and Data Space Ecosystems (61).

[4] Otto, Boris; Jarke, Matthias (2019): Designing a multi-sided data platform: findings from the International Data Spaces case. In: Electron Markets 29 (4), S. 561–580. DOI: 10.1007/s12525-019-00362-x.

[5] Federal Ministry for Economic Affairs and Energy (2020): GAIA-X: Policy Rules and Architecture of Standards. Hg. v. BMWI.

[6] Arnaut, Catarina; Pont, Marta; Scaria, Elizabeth; Berghmans, Arnaud; Leconte, Sophie (2018): Study on data sharing between companies in Europe. Final report : a study prepared for the European Commission DG Communications Networks, Content & Technology. European Commision. Luxembourg.