Startseite » Data Governance » Data Lineage – Definition und Beispiele in der Praxis

 

Was ist Data Lineage?

Mit der zunehmenden Digitalisierung steigen die Komplexität und die Vernetzung der Daten untereinander. Um einen klaren Durchblick zu schaffen, beschäftigen sich Data Management / Data Governance Experten mit Data Lineage.

Der Begriff „Data Lineage“ (oder auch „Data Provenance“) bedeutet sinngemäß ins Deutsche übersetzt Datenherkunft oder Datenabstammung, was den engeren Bedeutungskern bereits widerspiegelt.

Definition Data Lineage

Data Lineage is „a pathway along which it moves from its point of origin to its point of usage“.

DAMA International, Data Management Body Of Knowledge, Seite 28, 2. Auflage, 2017
Data Lineage – Definition und Beispiele in der Praxis

AndrewLozovyi/ © Depositphotos.com

Zweck Data Lineage

Eine umfassendere Vorstellung von Datenherkunft beschreibt der Data Lineage Ansatz. Dabei wird der gesamte Verarbeitungsweg (Data Chain / Data Flow) dokumentiert und analysiert: von den Abstammungsquellen der Daten über Methoden / Transformationen hinzu den finalen Verarbeitungsschritten und Auswertungen. So gelingt das Verständnis des Datenmodells im Unternehmen.

Da der Weg von der Quelle der Daten bis zur finalen Auswertung, dem abschließenden Bericht lang und beschwerlich ist, ist das Nachhalten des Weges ebenso schwer. Um den Nutzern die Nachverfolgung zu vereinfachen, sind gewisse Leitplanken einzuhalten. Bei den Nutzern handelt es sich nicht nur um die Fachabteilungen des Unternehmens. Auch Aufsichtsbehörden, Regulatoren und Prüfer sind Nutzer von Daten und haben ein Interesse an der Nachvollziehbarkeit des Weges.

Unterschiedliche Motivationen sprechen für den Aufbau eines Data Lineage Konzepts im Unternehmen und die Verfolgung der Datenquellen durch die Business Prozesse und Systeme:

  • Datenanalyse, Mapping Analyse und Data Mining
  • Data Cleansing (Implementierung, Bereinigung, Optimierung und Wartung)
  • Wissenschaftliche Zwecke
  • Regulatorische Zwecke (Berechtigungsmanagement, Compliance Anforderungen)

Bedeutung Data Lineage

Früher war Data Management eine Sache der IT. Aus der langanhaltenden Diskussion zwischen IT und Business (Fachbereiche) über die Verantwortung der Daten, sind einige gesetzliche und regulatorische Anforderungen entstanden. Diese Anforderungen verlangen, dass die Fachbereiche sich mit den Datenmodellen auseinandersetzen. Die Prozesse verlangen eine klare Strukturierung der Daten. Das Business muss erklären können, woher Daten stammen, wie sie verarbeitet werden und was sie beinhalten. Daher ist Data Lineage ein Muss für die Erfüllung der Anforderungen, aber auch, um die Zukunft gestalten zu können.

Insbesondere in den Finanz- und Risikobereichen hat das Thema an Bedeutung gewonnen.
Folgende Gründe haben dazu beigetragen:

  • Neue Rechts-, Compliance (MaRisk) und Rechnungsvorschriften (BCBS 239, DSGVO, IFRS9, BaFin-Solvency II, usw.)
  • Schnellere und komplexere Business- und Prozess-Veränderungen
  • Big Data und Probleme in der Qualität der Daten
  • Aufsichts- und Audit-Anforderungen (Datenableitungen und Datenbereitstellung auf granularer bzw. single deal Ebene)

Business Wettbewerbsfähigkeit hängt von der richtigen Strategie und Organisation ab. Die Grundlage dafür sind keine Bauchgefühle, sondern „data-driven“ (auf Fakten basierende) Entscheidungen.

Dies erfordert ein effizientes und professionelles Data Management sowie eine ganzheitliche Data Governance Strategie.

“Understanding the data lineage requires
documenting the origin of data sets, as well as their movement and transformation through systems where they are accessed and used.”

DAMA International, Data Management Body Of Knowledge, Seite 28, 2. Auflage, 2017

Data Lineage im Data Management

Die internationale und unabhängige DAMA Organisation hat das sogenannte Data Management Framework, also das Rahmenkonzept entwickelt.

Die konzeptionellen Grundlagen für Data Lineage werden hauptsächlich in folgenden Bereichen definiert:

  • Data Integration & Interoperability
  • Metadata Management
  • Data Modeling & Design

DAMA-DMBOK2 Data Management Framework Bildnachweis: Copyright © 2017 by DAMA International

Dabei hat Data Lineage einen enormen direkten und indirekten Einfluss auf fast alle Bereiche, sowohl aus der Business- aber auch aus der IT-Perspektive.

Data Lineage Tools in der Praxis

Zum Zwecke der Umsetzung des Data Lineage Ansatzes werden verschiedene Tools in der Praxis implementiert. Welche Tools bzw. Darstellungsmöglichkeit dabei im Unternehmen zum Einsatz kommen, hängt von vielen Faktoren ab (Kosten, Zeit- und Ressourcen-Aufwand). Zudem sollten sie sich an konkreten Unternehmenszielen sowie IT-Architektur (homogen oder heterogen) orientieren.

Um diese Ziele zu erreichen gibt es mehrere Alternativen (Entwicklung bzw. Fortführen eines eigenen Tools oder Nutzung von Standardsoftware bzw. bereits entwickelten Softwarebausteinen). Im Bankenumfeld sind uns beispielsweise zwei Tools aufgefallen, die bei Data Management / Data Lineage zum Einsatz kommen:

SAP Power Designer (Softwarehersteller SAP): Das Tool wird für Modellierungsaktivitäten genutzt, darunter zur Abbildung eines bankfachlichen Datamodells, sog. SAP Financial Services Data Management (FSDM) auf Basis SAP HANA und Financial Services Data Platform (FSDP).

D-QUANTUM (Softwarehersteller Synabi): Das Tool deckt mehrere Bereiche der Datenverwaltung ab, u.a. Data Lineage und Data Quality für den gesamten Lebenszyklus der Daten.

Data Lineage mit D-QUANTUM

Durch die Visualisierung von Data Lineages lassen sich mit dem D-QUANTUM Data Catalog von Synabi zahlreiche Erkenntnisse gewinnen. Dabei unterscheidet D-QUANTUM zwischen einer Business Lineage und einer Technical Lineage. Eine Business Lineage kann beispielsweise die fachliche Zusammensetzung einer Top-Risikokennzahl (bspw. Value at Risk) oder einer Rechnungswesen-Kennzahl (bspw. IFRS7 Restlaufkennzahl Notes) abbilden, während eine Technical Lineage technische Datenflüsse und Transformationen über Applikations- und Systemgrenzen hinweg darstellt.

Eine Business Lineage bildet fachliche Informationsobjekte ab und kann durchaus komplex und lang sein. Oft sind an der Abbildung einer Business Lineage mehrere Data Stewards aus unterschiedlichen Fachbereichen beteiligt. Aus diesem Grund legt der D-QUANTUM Data Catalog einen besonderen Wert auf Nutzer-Freundlichkeit und unterstützt aktiv die dezentrale Zusammenarbeit der Data Stewards und Data Owner durch Rollen, Verantwortungsdefinitionen und Abstimmungs-Workflows. Entscheidend ist, dass dezentral verteilte Wissen innerhalb der Organisation gesammelt und es allen Mitarbeitern zentral zur Verfügung gestellt wird.

Beispielhafte Business Lineage mit D-QUANTUM (Berechnung IFRS7 Restlaufkennzahl Notes)

Eine Technical Lineage bildet die Beziehung zwischen technischen Informationsobjekten aus unterschiedlichen IT-Systemen ab (z.B.: SAP ERP, Non-SAP Systeme, SAP FSDP). Je nach gewünschter Granularität kann man eine Technical Lineage auf Spaltenebene, Tabellenebene oder Applikationsebene umsetzen.

Im Rahmen von SAP FSDP Projekten extrahiert D-QUANTUM die Technical Lineage auf Spaltenebene (maximale Detailebene). Somit sind die D-QUANTUM Nutzer in der Lage den Datenfluss und die Schritte der Verarbeitung in der SAP HANA / FSDM Umgebung transparent nachzuvollziehen, von den für das Reporting verwendeten Calculation Views, über die Strukturen des FSDM, bis hin zu den SAP ERP Tabellen. Dafür sind keine Kenntnisse der Technologien notwendig, die Informationen können durch alle Fachanwender, auch ohne IT-Kenntnisse, analysiert und verwendet werden.

Beispielhafte Technical Lineage mit D-QUANTUM

Der D-QUANTUM Data Catalog bietet eine umfassende Plattform für Digitalisierungs- und Data Governance Vorhaben. Dazu gehören: Data Lineage Visualisierungen, konfigurierbare Datenmodelle, flexible Rollen und Workflows, sowie ein umfangreiches Reporting. Dies schafft Transparenz und ermöglicht Daten-Demokratisierung in komplexen und heterogenen Daten-Landschaften.

Die Synabi Business Solutions GmbH unterstützt Finanzinstitute mit dem D‑QUANTUM Data Catalog seit 2016. Mit der Erfahrung zahlreicher Projekte im Regulatorik- und Digitalisierungsumfeld ermöglicht Synabi ihren Kunden innovative Use Cases in den Themengebieten Metadatenmanagement, Datenqualitätsmanagement und Anforderungsmanagement.


Whitepaper Data Lineage

  • Definitionen und Beispiele in der Praxis
  • Alle wichtigen Informationen im Überblick

Quellen:

  • DAMA International, Data Management Body Of Knowledge, 2. Auflage, 2017
  • Basel Committee on Banking Supervision’s standard number 239 (BSBS 239), Datenschutz-Grundverordnung (DSGVO), International Financial Reporting Standards (IFRS), Bundes-Anstalt für Finanz-Dienstleistung-Aufsicht (BaFin), Solvabilitätsanforderung (Solvency)

Weitere Infos: