Optimierungs-Glossar

Abgeleitete Daten

Inhalt


    Was sind abgeleitete Daten?

    Abgeleitete Daten sind neue Informationen, die durch die Verarbeitung und Kombination vorhandener Rohdatensätze entstehen. Bei diesem Prozess werden verschiedene Datensätze miteinander verglichen und fortgeschrittene statistische Analysen durchgeführt, die Erkenntnisse liefern, die aus den ursprünglichen Daten nicht unmittelbar ersichtlich sind. Abgeleitete Daten sind nicht einfach eine Zusammenfassung oder Neuformatierung vorhandener Daten, sondern liefern völlig neue Erkenntnisse. Durch die Kombination von demografischen Informationen mit Kaufpräferenzen können Unternehmen beispielsweise neue Daten über das Kaufverhalten nach Alter, Geschlecht und Bildungsstand ableiten. Die abgeleiteten Daten können aus Beobachtungs-, Experimentier- oder Simulationsdaten stammen, nicht aber aus zuvor abgeleiteten Daten. Sie sind zwar wertvoll, bringen aber auch Herausforderungen in Bezug auf Genauigkeit, Datenschutz und Eigentumsverhältnisse mit sich.

    Warum sind abgeleitete Daten wertvoll?

    Wenn Sie ein Unternehmen besitzen, ist die Antwort wichtig. Ihre vorhandenen Daten enthalten nützliche Informationen, aber Sie gewinnen weitere Erkenntnisse, wenn Sie sie mit anderen Informationen kombinieren, um abgeleitete Daten zu erstellen. Wie erstellen Sie also abgeleitete Daten und wie können Sie sie in Ihrem Unternehmen nutzen?

    Abgeleitete Daten - das Wichtigste in Kürze

    • Abgeleitete Daten sind neue Daten, die durch die Kombination und Verarbeitung vorhandener Rohdaten entstehen.

    • Abgeleitete Daten können aus Beobachtungs-, Experimentier- und Simulationsdaten erstellt werden - nicht aber aus zuvor abgeleiteten Daten

    • Abgeleitete Daten liefern neue Erkenntnisse, die aus bestehenden Daten nicht gewonnen werden können, bringen aber auch eine Reihe von Problemen in Bezug auf Genauigkeit, Datenschutz und Eigentumsverhältnisse mit sich.

    Was sind abgeleitete Daten?

    Statista schätzt, dass im Jahr 2021 79 Billionen Gigabyte an Daten erzeugt werden - und das sind nur die Rohdaten. Unternehmen und Forscher auf der ganzen Welt leiten noch mehr Daten aus diesen Rohdaten ab - wir nennen das abgeleitete Daten.

    Abgeleitete Daten werden aus anderen vorhandenen Daten berechnet oder extrapoliert. Sie sind in der Regel das Ergebnis von Querverweisen oder einer anderweitigen Synthese verschiedener Datensätze und der Durchführung fortgeschrittener statistischer Analysen an diesem kombinierten Material. Aus diesem Grund sind die Informationen, die in abgeleiteten Daten enthalten sind, bei Betrachtung der Originaldaten nicht ohne weiteres ersichtlich. Sie existieren nicht, bis sie erstellt werden.

    diagram, venn diagram

    Bildquelle: Optimizely

    Betrachten Sie als einfaches Beispiel für abgeleitete Daten zwei verschiedene Datensätze aus der Datenanalyse. Der erste Datensatz enthält grundlegende demographische Informationen über eine Gruppe von Kunden. Der zweite Datensatz enthält Kaufpräferenzen über dieselben Kunden. Durch die Kombination und den Querverweis der beiden Datensätze lassen sich neue Erkenntnisse über die Kaufpräferenzen nach Alter, Geschlecht und Bildungsstand gewinnen. Bei diesen detaillierteren Informationen handelt es sich um abgeleitete Daten, die in keinem der ursprünglichen Datensätze ersichtlich sind.

    Abgeleitete Daten können mit verschiedenen Algorithmen gewonnen werden, z. B:

    • Extrahieren von Daten

    • Umstrukturierung von Daten

    • Anreicherung von Daten

    • Ableitung neuer Erkenntnisse

    • Generierung von Modellen

    Das Kopieren, Neuformatieren oder Neuverpacken von Daten führt nicht zu abgeleiteten Daten, und es handelt sich auch nicht um eine einfache Zusammenfassung vorhandener Daten. Abgeleitete Daten enthalten neue Informationen, die in den Originaldaten nicht enthalten sind.

    Was sind die verschiedenen Datentypen?

    Forscher unterteilen Daten in vier Grundtypen: Beobachtungsdaten, Experimentieren, Simulationen und abgeleitete Daten. Die ersten drei Arten von Daten werden manchmal als direkte Daten bezeichnet und unterscheiden sich deutlich von abgeleiteten Daten.

    1. Beobachtungsdaten

      Beobachtungsdaten werden durch die Beobachtung einer Aktivität oder die Befragung einer Person zu einer Aktivität erfasst. Die Zählung des Kundenverkehrs ist zum Beispiel eine Beobachtungsdaten.
    2. Experimentierende Daten

      Experimentelle Daten werden erhoben, wenn ein Forscher aktiv in eine bestimmte Aktivität eingreift und die daraus resultierenden Veränderungen misst. Bei einer Studie, bei der einigen Probanden ein experimentelles Medikament und anderen ein Placebo verabreicht wird, handelt es sich zum Beispiel um experimentelle Daten.
    3. Simulationsdaten

      Simulationsdaten werden erzeugt, indem ein realer Prozess mit Hilfe von Testmodellen nachgeahmt wird. Wenn Sie zum Beispiel eine Computersimulation der Belastung eines neuen Produkts durchführen, handelt es sich um Simulationsdaten.
    4. Abgeleitete Daten

      Wie Sie bereits gelernt haben, werden abgeleitete Daten erstellt, indem vorhandene Datenpunkte umgewandelt werden, um neue Erkenntnisse zu gewinnen. Wenn Sie beispielsweise Bevölkerungsdaten mit geografischen Daten kombinieren, um Daten zur Bevölkerungsdichte zu erhalten, handelt es sich um abgeleitete Daten.

      Abgeleitete Daten können aus jeder der drei anderen Arten von Daten extrahiert werden - sollten aber nicht aus anderen abgeleiteten Daten abgeleitet werden. Bei der Erstellung abgeleiteter Daten befolgen Forscher eine Reihe von Erfolgsmethoden, die die Eingabedaten, die Verarbeitung dieser Daten und die Genauigkeit der abgeleiteten Ergebnisse beschreiben.

    Welche Probleme sind mit abgeleiteten Daten verbunden?

    So nützlich abgeleitete Daten auch sein mögen, sie haben ihre eigenen Probleme, die sich aus der Art ihrer Erstellung ergeben.

    Probleme mit der Genauigkeit

    Abgeleitete Daten werden aus vorhandenen Daten extrapoliert und sind daher nicht so genau wie die Rohdaten. Abfragen auf abgeleitete Daten können weniger genaue Ergebnisse liefern als Abfragen auf die Originaldaten. Die Genauigkeit kann zu einem Problem werden, wenn abgeleitete Daten anschließend mit anderen abgeleiteten Daten verarbeitet werden, um eine neue Ebene von Daten zu schaffen. Das Szenario ist vergleichbar mit der Herausforderung, eine Kopie einer Kopie eines Fotos zu erstellen, die selten die Integrität des Originals beibehält. (Aus diesem Grund ist es ratsam, die Originaldaten anstelle der abgeleiteten Daten oder zusätzlich zu diesen zu speichern).

    Fragen des Datenschutzes

    Da abgeleitete Daten häufig aus der Analyse vorhandener Daten extrahiert werden, die mit der ausdrücklichen Zustimmung der Personen bereitgestellt wurden, wissen diese Personen in der Regel nichts von den neuen Informationen, die in den abgeleiteten Daten enthalten sind. Es stellt sich die Frage, ob die Erlaubnis zur Nutzung der Basisdaten auch die Erlaubnis zur Nutzung von abgeleiteten Daten einschließt, die nicht ausdrücklich in den Originaldaten enthalten sind.

    Fragen des Besitzes

    Im Zusammenhang mit dem Datenschutz und der Nutzung stellt sich auch die Frage, wem die abgeleiteten Daten gehören. Die ursprünglichen Daten stammen in der Regel aus einer bestimmten Quelle, aber durch die Kombination und Umwandlung dieser Daten entstehen völlig neue Datensätze. Haben die Eigentümer der ursprünglichen Daten Eigentumsansprüche an den abgeleiteten Daten oder gehören die abgeleiteten Daten vollständig dem Unternehmen, das die ursprünglichen Daten verarbeitet hat? Das Gesetz ist in diesem Punkt nicht eindeutig.

    Wie können Sie abgeleitete Daten in Ihrem Unternehmen nutzen?

    Abgeleitete Daten bieten entscheidende Einblicke, die in den Originaldaten nicht ohne weiteres erkennbar sind. Abgeleitete Daten beschränken sich nicht auf die statischen Beobachtungen der direkten Daten, sondern gehen über die Rohdaten hinaus, um neue Verbindungen herzustellen und neue Anwendungsfälle zu extrapolieren.

    Die Verwendung abgeleiteter Daten verschafft Ihrem Unternehmen einen deutlichen Wettbewerbsvorteil gegenüber anderen Unternehmen, die traditionellere Datenmodelle verwenden. Die Verwendung von abgeleiteten Daten kann Ihrem Unternehmen helfen:

    • die Wünsche, Bedürfnisse und Kaufmuster Ihrer Kunden besser zu verstehen

    • Ihre wertvollsten Kunden zu identifizieren

    • personalisierte Erlebnisse und Produkte für Ihre wertvollsten Kunden zu schaffen

    • Besseren Kundenservice anbieten

    • Effizienzsteigerung und Kostensenkung durch gezielteres Targeting Ihrer Bemühungen

    Kurz gesagt, wenn Sie über die von Ihnen gesammelten Rohdaten hinausgehen möchten, nutzen Sie die verfügbaren Analysetechniken, um neue, abgeleitete Daten zu synthetisieren. Diese abgeleiteten Daten liefern Ihrem Unternehmen erweiterte Erkenntnisse über Ihre Kunden, Ihren Markt und Ihr Unternehmen, die sich aus den ursprünglichen Daten nicht ableiten lassen.

    Lassen Sie sich von Optimizely dabei helfen, die Vorteile von abgeleiteten Daten zu nutzen

    Die Digital Experience Platform von Optimizely fasst Ihre vorhandenen Daten zusammen, um abgeleitete Daten zu erstellen, die Ihr Unternehmen voranbringen. So erhalten Sie verwertbare Erkenntnisse, die Sie nutzen können, um Ihre Zielgruppe besser zu definieren, personalisierte Erlebnisse zu bieten und Ihre E-Commerce-Aktivitäten zu optimieren. Werden Sie Partner von Optimizely, um das Beste aus all Ihren wertvollen Daten herauszuholen.