Was sind alternative Daten?

Unkonventionelle Datenquellen jenseits der Standardfinanzdaten – Satellitenbilder, Kreditkartentransaktionen, soziale Medien und Web-Traffic – für Geschäftseinblicke

von Databricks-Mitarbeiter

Umfasst unkonventionelle Daten wie Geodaten, App-Downloads, Web-Scraping, Versanddaten, Wetterdaten und Mitarbeiterbewertungen von Jobportalen.
Verschafft Hedgefonds und quantitativen Investoren Informationsvorsprünge, indem Markttrends aufgedeckt werden, bevor sich Veränderungen in traditionellen Finanzberichten und Kennzahlen widerspiegeln.
Erfordert spezielle Verarbeitungsmethoden für unstrukturierte Formate, die Berücksichtigung ethischer Datenschutzaspekte und fortgeschrittene Data-Science-Kenntnisse, um aussagekräftige Signale aus hochdimensionalen, verrauschten Datensätzen zu extrahieren.

Was sind alternative Daten?

Alternative Daten sind Informationen, die aus alternativen Datenquellen gewonnen werden, die andere nicht nutzen; d. h., aus nicht-konventionellen Datenquellen. Analysen alternativer Daten können Erkenntnisse liefern, die über das hinausgehen, was die regulären Datenquellen einer Branche liefern können. Was genau als alternative Daten gilt, variiert jedoch von Branche zu Branche, da es davon abhängt, mit welchen traditionellen Datenquellen Sie und Ihre Mitbewerber bereits arbeiten.

Typische alternative Datentypen

Wenn wir von alternativen Daten sprechen, gibt es eine Reihe von Datentypen, die hauptsächlich verwendet werden:

Satellitendaten,
mobile Daten,
Sensordaten
Webdaten.

Zu den alternativen Daten können jedoch auch gehören:

Geolokalisierung (Fußgängerverkehr),
Kreditkartentransaktionen,
E-Mail-Eingänge,
Point-of-Sale-Transaktionen,
Social-Media-Beiträge,
Online-Browsing-Aktivität,
Versandcontainerbelege,
Produktbewertungen,
Preis-Tracker,
Wetter- und Mikroklimadaten,
Flug- und Schiffs-Tracker.

In den letzten Jahren hat die Zunahme der von Mobilgeräten, Satelliten, Sensoren und Websites stammenden Daten zu riesigen Mengen strukturierter, halbstrukturierter und unstrukturierter Daten geführt, die wir unter dem Oberbegriff Big Data zusammenfassen. Durch die Nutzung alternativer Daten können Sie einzigartige Einblicke gewinnen, einen Wettbewerbsvorteil gegenüber der Konkurrenz erzielen und Ihre Gewinne steigern. Sie können Datensätze aus verschiedenen Quellen zusammenführen, um einen klaren Überblick über unternehmensspezifische, wettbewerbsorientierte Markszenarien zu erhalten. Es gibt im Wesentlichen drei Möglichkeiten, alternative Daten zu nutzen:

Erfassung von Rohdaten,
Lizenzierung durch Dritte,
Web Scraping (oder Web Harvesting oder Webdatenextraktion). Ein Web Scraper ist eine Anwendungsprogrammierschnittstelle (API), die Daten von einer Website extrahiert und in der Lage ist, wichtige Erkenntnisse zum gewünschten Thema zu sammeln, die Sie benötigen, um in Ihrer Branche erfolgreich zu sein. Neuere Formen des Web Scraping beinhalten Daten-Feeds von Webservern. JSON wird beispielsweise häufig als Transportspeichermechanismus zwischen dem Client und dem Webserver verwendet.

Automatisierte Scraping-Techniken

HTML-Analyse: Die HTML-Analyse erfolgt mithilfe von Java-Skripten und zielt auf lineare oder verschachtelte HTML-Seiten ab.
DOM-Analyse: Das Document Object Model oder DOM definiert den Stil, die Struktur und die Inhalte, die in den XML-Dateien enthalten sind.
Vertikale Aggregation: Plattformen für vertikale Aggregation werden von Unternehmen erstellt, die über eine enorme Datenverarbeitungsleistung verfügen, und sind auf bestimmte Branchen ausgerichtet.
XPath: XML Path Language oder XPath ist eine Abfragesprache, die für XML-Dokumente verwendet werden kann.
Google Docs: Google Sheets können im Wesentlichen so verwendet werden, als würden Sie einen Scraper in einer Programmiersprache wie Python oder Ruby schreiben. Daher sind sie eine gute und schnelle Möglichkeit, die Grundlagen bestimmter Scraper-Typen einzuführen.
Textmustervergleich: Hierbei handelt es sich um eine Technik zum Vergleich regulärer Ausdrücke, die den UNIX-Befehl „grep” verwendet und mit gängigen Programmiersprachen wie Perl oder Python kombiniert wird.

Zusätzliche Ressourcen

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Alle Blogs anzeigen

Was sind alternative Daten?

Typische alternative Datentypen

Das Playbook für agentenbasierte KI für Unternehmen

Automatisierte Scraping-Techniken

Zusätzliche Ressourcen

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Sign up