Die Konvergenz von Ereignis- und Zustandsdatenanalyse


Waren Sie schon einmal mitten in einer wichtigen Kundenanalyse und sind auf das gefürchtete IT-Szenario gestoßen: "Tut uns leid, wir können diese Daten nicht kombinieren, weil sie anders modelliert sind"? Es ist schwer, als Unternehmen datenorientiert zu arbeiten, wenn Sie ständig mit Situationen konfrontiert werden, in denen Sie zwar die Daten haben, Ihnen aber aus analytischer Sicht die Hände gebunden sind. Oft liegt das Problem darin, dass Sie Ihre Streaming-Daten in Bewegung nicht mit Ihren historischen Daten im Ruhezustand kombinieren können.
Die Menge der von Unternehmen gesammelten Ereignisdaten hat explosionsartig zugenommen - angeheizt durch die zunehmende Digitalisierung, die allgegenwärtige Instrumentierung von Online-Erlebnissen und die wachsende Zahl von vernetzten Geräten. Ereignisdaten, auch bekannt als "Daten in Bewegung", sind roh und auf Transaktionsebene. Sie strömen in großen Mengen ein und lassen sich daher nur schwer in herkömmliche Analysesysteme integrieren. Ihr Unternehmen kann sie daher möglicherweise nur für bestimmte, isolierte Anwendungsfälle nutzen, z. B. für die Analyse der Leistung Ihrer Website oder Ihrer Softwareanwendungen.
Die wahre Stärke von Ereignisdaten liegt jedoch in der Kombination mit Zustandsdaten - und Sie können alle Daten nutzen, um Ihr Produkt und Ihre Benutzer zu verstehen, unabhängig davon, wie die verschiedenen Arten von Daten dargestellt werden. Die Konvergenz von Daten in Bewegung und Daten im Ruhezustand ermöglicht die Analyse von Ereignisströmen: eine neue Art der Analyse, die Ihr Unternehmen in die Lage versetzt, taktische Entscheidungen in Echtzeit oder nahezu in Echtzeit zu treffen.
Was sind Ereignisdaten und wie unterscheiden sie sich von Zustandsdaten?
Ereignisdaten erfassen die Abfolge der Ereignisse hinter jedem Geschäftsprozess. Nehmen Sie ein vereinfachtes Beispiel für Benutzerinteraktionen auf einer E-Commerce-Website. Benutzer melden sich an, suchen und/oder blättern nach Produkten, legen Produkte in einen Warenkorb, gehen zur Kasse oder verlassen die Site.
Jede Benutzerinteraktion ist ein aufgezeichnetes Ereignis, das mit einem Zeitstempel und zugehörigen Metadaten versehen ist. Ereignisse sind verkettet: Jedes Ereignis kann ein vorangehendes und/oder ein nachfolgendes Ereignis haben. Die Interaktionssitzung eines bestimmten Benutzers kann in Form eines Ereignisflusses beschrieben werden, der den Weg des Benutzers entlang der möglichen Ereignisse und ihrer Übergänge aufzeigt.
Auf dem Weg dorthin führen die Ereignisse zu Änderungen der Zustände der Geschäftseinheiten. Es gibt Zwischenzustände, die in der Regel vorübergehend sind, wie z.B. der Zustand eines Warenkorbs während der Shopping-Session eines Benutzers. Wenn ein Zustand langfristig bestehen bleibt - wie z.B. eine von einem Kunden aufgegebene Bestellung - wird er in der Regel vom Unternehmen als Data-at-Rest gespeichert. Diese Zustandsdaten werden in der Regel als relationale Tabellen dargestellt und oft aggregiert, um eine übergeordnete Ansicht zu erstellen. Eine Faktentabelle Aufträge kann beispielsweise aggregierte Auftragsdaten für jeden Tag speichern. Das folgende Beispiel zeigt die Statusdaten für Bestellungen, Kunden und Produkte.
In der folgenden Tabelle finden Sie eine Zusammenfassung der wichtigsten Unterschiede zwischen Ereignisdaten und Zustandsdaten:
Wenn Ereignisdaten- und Zustandsdatenanalyse zusammenführen zu
Die Analyse von Ereignisdaten ist für sich genommen äußerst leistungsstark und kann viele Einblicke in das Verhalten von Menschen oder Maschinen liefern. Mit der Ereignisflussanalyse ist es möglich, Muster in allen Bereichen zu erkennen, von der Benutzerreise bis hin zum Ablauf von Geschäftsprozessen. Daten in Bewegung können auch kontinuierlich überwacht werden, um schnell auf Anomalien und Chancen reagieren zu können. Es ist wichtig zu wissen, dass für die Analyse von Ereignisdaten eine Ausdrucksfähigkeit erforderlich ist, die über SQL hinausgeht, sowie Compute Engines, die speziell für effiziente Sequenzoperationen ausgelegt sind.
Die eigentliche Stärke liegt jedoch darin, dass die Ereignisanalyse durch die Einbeziehung von mehr Kontext aus Zustandsdaten verbessert wird.
Die Analyse von Zustandsdaten (Berichterstattung über historische Daten) ist in der Regel eher strategisch als operativ. Aber stellen Sie sich vor, Sie hätten strategische Erkenntnisse zur Hand, wenn Sie eine taktische oder operative Möglichkeit haben, ein Kundenerlebnis oder einen Geschäftsprozess unmittelbar zu beeinflussen.
Beispiel
Nehmen wir das hypothetische E-Commerce-Geschäft von vorhin. Ein Beispiel für die Analyse von Ereignisdaten ist: Zeigen Sie mir die Checkout- und Abbruchraten für Benutzer, die innerhalb von 3 Minuten nach der Anmeldung 4 Mal hintereinander Such- und Browsing-Aktionen durchgeführt haben. In diesem Szenario versucht ein Analyst vielleicht, die Effektivität der Produktsuche auf der Site zu verstehen.
Was aber, wenn der Analyst die Effektivität der Suche in Bezug auf andere Geschäftsdimensionen und Metriken verstehen möchte? Zum Beispiel: Zeigen Sie mir die Checkout- und Abbruchraten für Benutzer, die innerhalb von 3 Minuten nach der Anmeldung 4 Mal hintereinander Such- und Browsing-Aktionen durchgeführt haben, aufgeschlüsselt nach Produktkategorie und Kundensegmentierung und beschränkt auf die Top 5 Regionen nach Ausgaben. Beachten Sie, dass es sich bei "Produktkategorie", "Kundensegment", "Region" und "Ausgaben" um Statusdaten handelt, die im Ereignisstrom nicht verfügbar sind. In Unternehmen ist ein solcher Geschäftskontext in der Regel in mehreren Systemen vorhanden: Data Warehouses, Data Lakes, operative Datenspeicher, SaaS-Dienste wie Salesforce oder Zendesk, Datenfeeds von Drittanbietern usw. Die Fähigkeit, Daten über Ereignisströme und statische Zustandsspeicher hinweg zu kombinieren, zu modellieren und zu berechnen, ist eine schwierige, aber wichtige Funktion für effektive Analysen.
Umfassendere datengesteuerte Entscheidungen
Die Zusammenführung von Ereignis- und Zustandsdatenanalysen eröffnet leistungsstarke Möglichkeiten zur Verbesserung von Geschäftsergebnissen. In der Vergangenheit waren diese beiden Welten immer isoliert, was zu suboptimalen Analysen und verpassten Chancen führte. Jetzt gibt es moderne Operational Intelligence-Plattformen, die diese Konvergenz Wirklichkeit werden lassen und eine neue Ära der Ereignisdatenanalyse einläuten.
Wenn Sie alle Ihre Daten zur Hand haben - unabhängig davon, woher sie stammen oder wie sie im Code modelliert sind - können Sie bessere datengestützte Entscheidungen treffen. Sie können neue analytische Fragen stellen und Erkenntnisse gewinnen, indem Sie das, was Sie über die Aktionen Ihrer Kunden in Echtzeit wissen, mit dem kombinieren, was Sie über deren historisches Verhalten wissen. Diese Erkenntnisse können sogar genutzt werden, um automatisch neue Arten von Produkten zu entwickeln - so legen beispielsweise Unternehmen wie Amazon oder Uber Preise fest und handhaben die Logistik.