Publicerad mars 11, 2022

Konvergera analys av händelse- och tillståndsdata

diagram

Har du någonsin varit mitt uppe i en viktig kundanalys och stött på det fruktade IT-scenariot: "Tyvärr, vi kan inte kombinera den här datan eftersom den är modellerad på olika sätt"? Det är svårt att vara datadriven som företag när man ständigt stöter på situationer där man har datan, men där man är bakbunden ur ett analysperspektiv. Ofta beror problemet på att du inte kan kombinera dina strömmande data i rörelse med dina historiska data i vila.

Det har skett en explosionsartad ökning av mängden datainsamling från företag - drivet av ökad digitalisering, genomgripande instrumentering av onlineupplevelser och tillväxt i antalet anslutna enheter. Händelsedata, även kallad "data i rörelse", är rå och på transaktionsnivå. De strömmar in i stora volymer, vilket gör dem extremt svåra att implementera i traditionella analyssystem. Ditt företag kanske bara kan använda dem för specifika, åtskilda användningsområden, som att analysera prestandan på din webbplats eller i dina programvaruapplikationer.

Men den verkliga kraften i händelsedata är när den kombineras med tillståndsdata - och du kan använda all din data för att förstå din produkt och dina användare, oavsett hur olika typer av data representeras. Konvergeringen av data i rörelse och data i vila öppnar upp för analys av händelseströmmar: en ny typ av analys som ger ditt företag möjlighet att fatta taktiska beslut i realtid eller nästan i realtid.

Vad är händelsedata och hur skiljer det sig från tillståndsdata?

Händelsedata fångar upp händelseförloppet bakom varje affärsprocess. Ta ett förenklat exempel på användarinteraktioner på en webbplats för e-handel. Användare loggar in, söker och/eller bläddrar efter produkter, lägger till produkter i en varukorg, checkar ut eller lämnar webbplatsen.

Varje användarinteraktion är en registrerad händelse, med en tidsstämpel och tillhörande metadata. Händelserna är kedjade: varje händelse kan ha en föregående händelse och/eller en efterföljande händelse. En viss användares interaktionssession kan beskrivas i form av ett användarflöde som visar den väg som användaren tog längs den möjliga uppsättningen händelser och deras övergångar.

Längs vägen orsakar händelser förändringar i affärsenheternas tillstånd. Det finns mellanliggande tillstånd som vanligtvis är övergående, t.ex. tillståndet för en varukorg under en användares shoppingsession. När ett tillstånd kvarstår under lång tid - t.ex. en beställning som görs av en kund - lagras det vanligtvis av verksamheten som data-at-rest. Dessa tillståndsdata representeras vanligtvis som relationstabeller och aggregeras ofta för att skapa en vy på högre nivå. Till exempel kan en faktatabell Orders lagra aggregerade orderdata för varje dag. I exemplet nedan visas tillståndsdata för Order, Kunder och Produkter.

Här är ett diagram som sammanfattar de viktigaste skillnaderna mellan händelsedata och tillståndsdata:

När analys av händelsedata och tillståndsdata konvergerar

Analys av händelsedata är i sig extremt kraftfullt och kan ge många insikter om mänskligt eller maskinellt beteende. Med händelseflödesanalys är det möjligt att förstå mönster i allt från användarresor till affärsprocessflöden. Data i rörelse kan också övervakas kontinuerligt för snabba åtgärder vid avvikelser och möjligheter. Det är viktigt att notera att analys av händelsedata kräver uttrycksmöjligheter som går utöver SQL, samt beräkningsmotorer som är särskilt anpassade för effektiva sekvensoperationer.

Den verkliga kraften kommer dock från att ta in rikare sammanhang från tillståndsdata för att förbättra händelseanalysen.

Analys av tillståndsdata (rapportering av historiska data) är vanligtvis mer strategisk än operativ. Men tänk dig att ha strategiska insikter till hands när du har en taktisk eller operativ möjlighet att omedelbart påverka en kundupplevelse eller affärsprocess.

Ett exempel

Tänk på den hypotetiska e-handeln från tidigare. Ett exempel på analys av händelsedata är: Visa mig checkout- och övergivandegrader för användare som gjorde sök- och bläddringsåtgärder 4 gånger i rad inom 3 minuter efter inloggning. I det här scenariot kanske en analytiker försöker förstå hur effektiv produktsökningen är på webbplatsen.

Men tänk om analytikern vill förstå hur effektiv sökningen är i förhållande till andra affärsdimensioner och mätvärden? Ett exempel: Visa mig checkout och övergivna köp för användare som gjorde sök- och bläddringsåtgärder 4 gånger i rad inom 3 minuter efter inloggning ,uppdelat per produktkategori och kundsegment, begränsat till de 5 största regionerna efterutgifter. Observera att "produktkategori", "kundsegment", "region" och "utgifter" är tillståndsdata som inte är tillgängliga i händelseströmmen. I företag tenderar sådana affärssystem att finnas i flera system: datalager, datasjöar, operativa datalager, SaaS-tjänster som Salesforce eller Zendesk, tredjepartsdata, etc. Möjligheten att kombinera, modellera och beräkna data från olika händelseströmmar och statiska datalager är en svår men viktig funktion för effektiv analys.

Mer kompletta datadrivna beslut

Genom att konvergera händelse- och tillståndsdataanalys öppnas kraftfulla möjligheter att förbättra affärsresultaten. Historiskt sett har dessa två världar alltid varit åtskilda, vilket har resulterat i suboptimala analyser och förlorade möjligheter. Nu växer moderna plattformar för operativ intelligens fram som gör denna konvergering till verklighet och inleder en ny era av analys av händelsedata.

Med all din data till hands - oavsett var den kommer ifrån eller hur den är modellerad i kod - kan du fatta bättre datadrivna beslut. Du kan utforska nya analytiska frågor och få insikter genom att kombinera det du vet om dina kunders agerande i realtid med det du vet om deras historiska beteende. Dessa insikter kan till och med användas för att automatiskt driva nya typer av produkter - till exempel är det så här företag som Amazon eller Uber sätter priser och hanterar logistik.