Härledda data
Innehållsförteckning
Vad är härledda data?
Härledda data eller på engelska derived data är ny information som skapas genom att bearbeta och kombinera befintliga rådatauppsättningar. I den här processen ingår korsreferenser mellan olika datauppsättningar och avancerad statistisk analys, som ger insikter som inte är omedelbart uppenbara utifrån originaldata. Härledda data är inte bara en sammanfattning eller omformatering av befintliga data, utan ger helt nya insikter. Genom att kombinera demografisk information med köppreferenser kan företag till exempel härleda nya data om köpbeteenden efter ålder, kön och utbildningsnivå. Härledda data kan komma från observations-, experimenterings- eller simuleringsdata, men inte från tidigare härledda data. De är värdefulla, men medför också utmaningar när det gäller noggrannhet, integritet och ägande.
Varför är härledda data värdefull?
Om du äger ett företag är svaret mycket viktigt. Dina befintliga data innehåller användbar information, men du får ytterligare insikter när du kombinerar dem med annan information för att skapa härledda data. Så hur skapar du härledda data och hur kan du använda den i ditt företag?
Viktigast att känna till om härledda data
-
Härledda data är ny data som skapas genom att kombinera och bearbeta befintlig rådata
-
Härledda data kan skapas från observations-, experimenterings- och simuleringsdata - men inte från tidigare härledda data
-
Härledda data ger nya insikter som inte är tillgängliga från befintlig data - men kommer med sin egen uppsättning av frågor om noggrannhet, integritet och äganderätt
Vad är härledda data?
Statista uppskattar att 79 biljoner gigabyte data genererades under 2021 - och det är bara rådata. Företag och forskare världen över härleder ännu mer data från denna råa information - det vi kallar härledda data.
Härledda data är beräknad eller extrapolerad från annan befintlig data. Det är vanligtvis resultatet av korsreferenser eller annan syntes av olika dataset och avancerad statistisk analys av det kombinerade materialet. På grund av detta är den information som avslöjas i härledda data inte uppenbar när man observerar originaldata. Den existerar inte förrän den har skapats.
Bildkälla: Optimizely
Som ett enkelt exempel på härledda data kan man tänka sig två olika uppsättningar dataanalys. Den första datauppsättningen innehåller grundläggande demografisk information om en uppsättning kunder. Den andra datauppsättningen innehåller köppreferenser om samma kunder. Genom att kombinera och korsreferera de två datauppsättningarna kan nya insikter om köppreferenser efter ålder, kön och utbildningsnivå avslöjas. Denna mer detaljerade information är härledda data som inte framgår av någon av de ursprungliga datauppsättningarna.
Data kan härledas i flera olika algoritmer, bland annat
-
Extrahera data
-
Omstrukturering av data
-
Förstärkning av data
-
Inferens av nya insikter
-
Generera modeller
Kopiering, omformatering eller ompaketering av data skapar inte härledda data, och det är inte heller bara en sammanfattning av befintliga data. Härledda data innehåller ny information som inte finns i originaldata.
Vilka är de olika typerna av data?
Forskare delar in data i fyra grundläggande typer: observation, experimentering, simulering och härledda data. De tre första typerna av data kallas ibland direkta data och skiljer sig tydligt från härledda data.
-
Observationsdata
Observationsdata samlas in genom att man observerar en aktivitet eller frågar en person om en aktivitet. Att till exempel räkna kundtrafik är observationsdata. -
Experimentella data
Experimentella data samlas in när en forskare aktivt ingriper i en viss aktivitet och mäter de förändringar som uppstår. Exempelvis är en studie där vissa försökspersoner får ett experimentellt läkemedel och andra får placebo experimentell data. -
Simuleringsdata
Simuleringsdata genereras genom att efterlikna en verklig process med hjälp av testmodeller. Att köra en datorsimulering av stressnivåer på en ny produkt är till exempel simuleringsdata. -
Härledda data
Som du har lärt dig skapas härledda data genom att omvandla befintliga datapunkter för att skapa nya insikter. Att till exempel kombinera befolkningsdata med geografiska data för att skapa data om befolkningstäthet anses vara härledda data.
Härledda data kan extraheras från någon av de andra tre typerna av data - men bör inte härledas från andra härledda data. När forskare skapar härledda data följer de en rad bästa praxis som beskriver indata, hur dessa data bearbetas och noggrannheten i de härledda resultaten.
Vilka problem är förknippade med härledda data?
Härledda data är visserligen användbara, men de har också sina unika problem som beror på hur de skapas.
Problem med noggrannhet
Härledda data extrapoleras från befintliga data och är därför inte lika exakta som rådata. Frågor som ställs på härledda data kan generera mindre exakta resultat än frågor som ställs på originaldata. Noggrannheten kan bli ett problem om härledda data sedan bearbetas med andra härledda data för att skapa en ny datanivå. Scenariot liknar utmaningen med att göra en kopia av en kopia av ett fotografi, som sällan behåller originalets integritet. (Av detta skäl är det klokt att lagra originaldata i stället för eller utöver de härledda data).
Integritetsfrågor
Eftersom härledda data ofta extraheras från analysen av befintliga data som tillhandahålls med uttryckligt tillstånd från enskilda personer, är dessa personer vanligtvis omedvetna om den nya information som avslöjas i de härledda data. Frågan kvarstår om det tillstånd som ges för att använda basinformationen innebär ett tillstånd att använda härledda data som inte uttryckligen ingår i originaldata.
Frågor om äganderätt
Parallellt med integritets- och användningsfrågorna finns frågan om vem som äger de härledda data. Originaldata kommer vanligtvis från en identifierad källa, men när dessa data kombineras och omvandlas skapas helt nya dataset. Har ägarna till de ursprungliga uppgifterna äganderätt till de härledda uppgifterna eller ägs de härledda uppgifterna helt och hållet av den enhet som behandlade de ursprungliga uppgifterna? Lagen är inte entydig på denna punkt.
Hur kan du använda härledda data i ditt företag?
Härledda data ger kritiska insikter som inte är uppenbara i originaldata. I stället för att vara begränsade till de statiska observationerna i direkta data går härledda data bortom rådata för att skapa nya kopplingar och extrapolera nya användningsområden.
Att använda härledda data ger ditt företag en tydlig konkurrensfördel jämfört med andra företag som använder mer traditionella datamodeller. Användningen av härledda data kan hjälpa ditt företag att
-
Få bättre förståelse för kundernas önskemål, behov och köpmönster
-
Identifiera dina mest värdefulla kunder
-
Skapa personaliserade upplevelser och produkter för dina mest värdefulla kunder
-
Tillhandahålla bättre kundservice
-
Förbättra effektiviteten och minska kostnaderna genom att bättre målgruppsinrikta dina insatser
Kort sagt, när du vill gå bortom de rådata du samlar in, använd tillgängliga analytiska tekniker för att syntetisera nya, härledda data. Dessa härledda data ger ditt företag avancerade insikter om dina kunder, din marknad och ditt företag som inte är tillgängliga från originaldata.
Låt Optimizely hjälpa dig att skörda fördelarna med härledda data
Optimizely's Digital Experience Platform syntetiserar din befintliga data för att skapa härledda data som hjälper dig att driva ditt företag. Detta skapar handlingsbara insikter som du kan använda för att bättre definiera din målgrupp, tillhandahålla personaliserade kundupplevelser och finjustera dina aktiviteter inom e-handel. Partner med Optimizely för att få ut mesta möjliga av all din värdefulla data.