Was ist eine Graphdatenbank?

In der heutigen extrem vernetzten, digitalisierten Welt werden immer mehr Daten hinterlassen. Neben der reinen Zahl steigt auch das Ausmaß der Verknüpfungen zwischen den Daten selbst sowie die Anzahl verschiedener Datentypen. Herkömmliche Datenbanken sind in der Regel relational, das heißt, sie speichern die Daten getrennt nach Datentypen in Tabellen. Für miteinander verknüpfte Daten sind sie nicht ausgelegt. Graphdatenbanken können Datenzusammenhänge auf der Grundlage von Graphen hingegen sichtbar machen, diese zueinander in Beziehung setzen und bewerten.

Verwendet werden Graphdatenbanken beispielsweise zur Auswertung der Nutzerbeziehungen in sozialen Netzwerken wie Facebook oder des Kaufverhaltens von Nutzern im E-Commerce. Sie können aber auch im Supply Chain Management hilfreich sein.

Vorteile von Graphdatenbanken für die Supply Chain

Lieferketten sind häufig komplexe Gebilde, die verschiedene Ebenen umfassen. Sie erstrecken sich vom Hersteller über verarbeitende Unternehmen bis hin zum Händler, der das fertige Produkt an den Endkunden verkauft. Beispiel Automobilindustrie: Die Hersteller nutzen in diesem Bereich ein vielschichtiges und weitverzweigtes Netzwerk aus Lieferanten, Händlern und Partnern, die global kooperieren. Dabei verläuft die Supply Chain nicht geradlinig, sondern setzt sich über mehrere Ebenen hinweg fort. Hier eine 360-Grad-Transparenz zu gewährleisten, ist eine enorme Herausforderung.

Doch gerade im Krisenfall gewährt eine durchgängige Nachverfolgbarkeit viele Vorteile. Muss ein Hersteller beispielsweise eine Rückrufaktion starten und dazu alle Produkte identifizieren, in denen das vom Rückruf betroffene Teil enthalten ist, sind Graphdatenbanken eine große Hilfe. Sie können stark vernetzte oder auch unstrukturierte Informationen anschaulich darstellen und ermöglichen nicht nur mehrere lineare Verknüpfungen, sondern auch Verknüpfungen in alle Richtungen zwischen den verschiedenen Akteuren einer Supply Chain.

Graphdatenbanken können also Zusammenhänge einer Lieferkette aufzeigen und alle direkten und indirekten Nachbarn eines Produkts, Bauteils oder Lieferanten identifizieren. So lassen sich große Datenmengen nicht nur strukturiert durchsuchen und verwalten, sondern auch problemlos ändern und neue Daten unterschiedlicher Art hinzufügen, etwa gesetzliche Neuregelungen oder neue Zulieferer und Produkte.

Ein weiterer Vorteil von Graphdatenbanken ist deren Performance. Die Abfragegeschwindigkeit kann im Vergleich zu relationalen Datenbanken je nach Anwendungsfall 100 bis 1.000 Mal schneller sein.

Drei bekannte Graphdatenbanken

Der Funktionsumfang der verfügbaren Graphdatenbanken unterscheidet sich zum Teil deutlich. Diese drei Modelle gehören zu den bekanntesten:
 

  • Neo4j ist die beliebteste Graphdatenbank und als Open-Source-Modell aufgebaut. Mit ihrer Hilfe lassen sich sehr komplexe Datenzusammenhänge in hoher Geschwindigkeit abfragen.
  • OrientDB gilt als eines der schnellsten aktuell verfügbaren Modelle, das sich insbesondere zur Archivierung und Abfrage von Dokumenten eignet.
  • Amazon Neptune ist eine Closed-Source-Graphdatenbank in der Cloud von Amazon Web Services.