Einführung

Vertrauen, Interoperabilität und Datensouveränität, das sind die Ziele und Werte für einen sicheren und nachhaltigen Peer-to-Peer Datenaustausch zwischen Organisationen und Firmen. Der Anspruch ist Datensouveränität: Wer Daten zur Verfügung stellt, behält die Kontrolle und entscheidet individuell, wer am Datenaustausch wie, wann, wo und unter welchen Bedingungen beteiligt wird.

Im Kontext von Gaia -X und der International Data Spaces Association (IDSA) wurde ein entsprechendes Konzept entwickelt. Die wesentliche Software-Komponente ist dabei der Konnektor.

Erweiterte Funktionalität durch den Eclipse Data Space Connector (EDC)

Catena-X hat das Konzept hinsichtlich Datendurchsatz und Kontrolle der Souveränität erweitert. Mit dem Eclipse Data Space Connector (EDC) wurde eine neue zentrale Kommunikationskomponente für Catena-X geschaffen, die die folgenden Architektur-Prinzipien umsetzt:

  • Einfach, Erhaltung eines kleinen und effizienten Kerns mit so wenig externen Abhängigkeiten wie möglich
  • Interoperabel, unabhängig von Plattformen und Ökosystemen
  • Dezentral, Softwarekomponenten mit den erforderlichen Fähigkeiten zur Teilnahme an einem Datenraum befinden sich jeweils auf Seiten der Partner, Daten werden nur zwischen den vereinbarten Punkten ausgetauscht.
  • Datenschutz ist wichtiger als Data Sharing, zu übertragende Daten sind grundsätzlich mit Policies über Verträge verbunden; eine Übertragung ohne Vertrag ist nicht möglich.
  • Separierung von Metadaten und Daten, ermöglicht hohe Durchsatzraten für den eigentlichen Datentransfer.
  • Eine durchgehende Semantik für die Daten ist die Grundlage für die Durchgängigkeit der digitalen Wertschöpfung.  
  • Möglichst alle Prozesse, beginnend mit der Feststellung der Identität, über die Sicherstellung der vertraglich vereinbarten Regularien bis hin zur Datenübertragung laufen automatisiert.
  • Existierende Standards und Protokolle (GAIA-X + IDSA), werden so weit wie möglich verwendet.

Der EDC als Konnektor setzt eine Rahmenvereinbarung für den souveränen, organisationsübergreifenden Datenaustausch um.  Implementiert wurde der International Data Spaces Standard (IDS) sowie relevante Prinzipien im Zusammenhang mit GAIA-X. Der Konnektor ist erweiterbar konzipiert, um alternative Protokolle zu unterstützen und in verschiedene Ökosysteme integriert zu werden. 

Ziel ist der Aufbau einer dezentralen Softwarekomponente auf Seiten des jeweiligen Partners, die die erforderlichen Fähigkeiten zur Teilnahme an einem Datenraum bündelt und Peer-to-Peer-Verbindungen zwischen Teilnehmern ermöglicht. Hier liegt der Fokus insbesondere auf der Datensouveränität der unabhängigen Firmen. Die dafür notwendige Funktionalität bündelt das Open-Source Projekt „Eclipse Dataspace Connector“, zu dem die Catena-X Partner im Rahmen der Eclipse Foundation beitragen. 

Der Hauptunterschied zwischen dem EDC und den bisherigen Konnektoren der IDSA ist die Aufteilung der Kommunikation in einen Kanal für die Metadaten und einen für den eigentlichen Datenaustausch.  Der Kanal für die Daten unterstützt über sogenannte Data Plane Extension verschiedenen Übertragungsprotokolle. Die Metadaten werden dabei direkt über der Schnittstelle des EDC übertragen, während der eigentliche Datenaustausch dann über die passende Channel Extension stattfindet. Auf diese Weise wird flexibel ein hoch skalierbarer Datenaustausch ermöglicht.

Die Architektur des EDC vereint verschieden Dienste in sich, die für die oben genannten Prinzipien notwendig sind:

  • Eine Schnittstelle zum Dienst des Identitäts-Provider, zurzeit zum Dynamic Attribute Provisioning System (DAPS) des IDSA. Dieser zentrale Dienst liefert die Identität und die entsprechende Authentifizierung der Teilnehmer am Datenaustauch. (Es findet an dieser Stelle noch keine Autorisierung statt). In Zukunft werden auch dezentrale Lösungen unterstützt.
  • Die Bereitstellung der möglichen Angebote (Contract Offering) die zum einem die angebotenen Daten und die dazugehörigen Nutzungsbedingungen (Policies) festgehalten in entsprechenden Verträgen.
  • Eine Schnittstelle zur manuellen Auswahl der Daten und zugehörigen Vertragsangebote.
  • Den eigentlichen Datentransfer über die Channel Extension
  • Schnittstellen zur Nutzung weiterer Dienste wie z.B. eines Broker-Dienstes oder einer Registrierungsdienstes
  • Die Anbindung von Software-Systemen auf Kunden- und Anbieterseite

Die folgende Abbildung gibt einen groben Überblick über bereits für Tests verfügbare Dienste und die weitere Planung.

Hinsichtlich der software-technischen Umsetzung besteht das EDC-Modul aus den beiden Bereichen, „Control Plane“ und „Data Plane“. Im Data Plane werden unterschiedlichen Kommunikationsprotokolle wie https, S3 File Transfer, REST über die „Channel Extension“ integriert. Das Control Plane besteht aus Komponenten für die Behandlung von Verträgen und dem „EDC Standard API“, das die Schnittstelle für jegliche Interaktion des Konnektors, also zu den Backend-Data-Services und dem Datentransfer. Die Verweise rund um das Thema Verträge werden in vier Verzeichnissen (Indizes) abgelegt.

  • Im „Contract Definition Index“ werden alle verfügbare Vertragsentwürfe als Templates gelistet, darüber werden die Nutzungsregeln (Policies) abgebildet.
  • Im „Asset Index“ werden die verfügbaren Daten und Informationen, die eigentlichen Assets für den angestrebten Datenaustausch verzeichnet.
  •  Im „Contract Offer“ Index werden spezifische Vertragsangebote geführt, die aus den Templates abgeleitet werden und die den Verweis auf die entsprechenden Assets und Regeln für den Austausch enthalten.

Kommt es dann schließlich zu dem Abschluss von Verträgen, werden die Verweise auf diese Verträge im „Contract Index“ abgelegt.

Funktionsweise

Wie funktionert nun der Datenaustausch zwischen zwei Partnern via EDC?

Vorausgesetzt, dass die Identitäten abgefragt und verifiziert wurden, also die Teilnehmer identifiziert und authentifiziert sind, fragt der Kunde beim potenziellen Lieferanten die verfügbaren Vertragsangebote mit den Daten (Assets) und deren Regeln (Policies) ab und wählt letztlich einen oder mehrere Verträge aus. Der Provider bestätigt den Vertrag und sendet diesen zu (Agreement). Sowohl der Kunde als auch der Lieferant speichern die gültigen Verträge jeweils in ihrem Contract Index. Damit ist dann die Autorisierung für den Datentransfer gegeben. Auf Basis der gültigen Verträge werden nun Token generiert, die für die Durchsetzung der Verträge beim Datentransfer genutzt werden.

 

Der EDC wird nicht nur für die Kommunikation zwischen zwei Teilnehmern genutzt, sondern kann für jeden Datenaustausch innerhalb des Datenraums verwendet werden. So werden auch die föderierten Dienste über den EDC angebunden.

Stand der Entwicklung

Der EDC wird noch ständig im Rahmen des Catena-X Consortium und der Eclipse Foundation weiterentwickelt. Die aktuellen Versionen können von GitHub (eclipse-dataspaceconnector/DataSpaceConnector: DataspaceConnector project (github.com) ) heruntergeladen werden. Die Qualität reicht für die Demonstration.

Zukünftige geplante Entwicklungen:

  1. In Zukunft ist vorgesehen, für die Identifizierung auch dezentrale Lösungen zu unterstützen. Ein erfolgversprechendes Konzept beruht auf den selbstbestimmten Identitäten (SSI – Self Sovereign Identity), das in dem europäischen „European Self Sovereign Identity Framework“ (ESSIF) und von Gaia-X entwickelt wird. In Ergänzung wird innerhalb Catena-X das Konzept eines Geschäftspartner-Daten-Management-Systems (GPDM) entwickelt, das über die Identität einer BPN (Business Partner Number) verteilte Informationen einer Firma aus den verschiedensten Datenquellen zusammenführt, für die Selbstbeschreibung nutzt und anschließend über die Datenquellen synchronisiert.
  2. Mehr Flexibilität des allgemeinen Datentransfers: Geplant sind weitere Channel-Extensions, insbesondere auch für Streaming-Protokolle wie Kafka und MQTT. Auch die verstärkte Integration der Industrie 4.0-Verwaltungsschale steht auf der Roadmap. Dabei ist bereits mit dem Verwaltungsschale-API-Wrapper begonnen worden, der für eine Industrie-4.0-Anwendung die Kommunikation über den EDC transparent als Datenzugriff über die Verwaltungsschale abbildet. Offen ist die Integration der Verwaltungsschale als Extension für die Backend-Data-Services.
  3. Insgesamt ist die Anbindung über Channel-Extensions von weiteren Backend-Data-Services (ERP, MES, PPS, …) eine wesentliche Aktivität des Konsortiums.
Redaktionsstand: 25.08.2022

Dies ist ein Arbeitsergebnis des
Catena-X Automotive Network Konsortialprojekts,
gefördert durch das Bundesministerium für Wirtschaft und Klimaschutz.
Förderkennzeichen: 13IK004*