Big Data ist eines der Schlagworte des vergangenen Jahres: Unternehmen und Marketingexperten entdecken die Daten, die die Nutzer im Internet hinterlassen, zunehmend als Grundlage, um zielgruppengerechte Angebote und Kommunikationsstrategien zu entwickeln.
Der Informatiker David Kriesel verfolgt mit Akribie, wie aus diesen Daten Wissen generiert werden kann, aber auch wozu eine Vorratsdatenspeicherung womöglich führt. Bei einem Kongress des Chaos Computer Clubs (CCC) hat Kriesel jetzt ein Lehrstück in Sachen Big Data und Data-Science abgeliefert und dazu seit 2014 massenhaft Daten von „SPIEGEL ONLINE“ abgegriffen. Ziel seines im Sommer 2016 als Blog gestarteten Projekts „SpiegelMining“: als Außenstehender nur anhand von Daten nachzuvollziehen, wie die Redaktion des populären Nachrichtenportals funktioniert.
In seinem knapp einstündigen CCC-Vortrag präsentiert Kriesel, wie er aus frei zugänglichen Daten Personal- und Teamstrukturen herauslesen kann, wo offensichtlich „Filterblasen“ existieren, aber auch, wie Wettbewerber erkennen könnten, welche Ressorts für „SPIEGEL ONLINE“ womöglich an Bedeutung verlieren. Anhand seines Datensatzes erklärt er zudem die Mechanismen und Methoden der Datenanalyse:
- Grundlegende Aspekte der Datenerhebung
- Möglichkeiten, die sich allein durch das Sammeln und kombinierte Auswerten von Metadaten wie Veröffentlichungszeitpunkt, Rubrikenkennung oder Autorenname ergeben
- Visualisierungsmethoden einschließlich Tipps für entsprechende Software, damit auch Laien die Daten korrekt lesen können
- Fallstricke der Datenanalyse, unter anderem durch vermeintlich logische Schlussfolgerungen, die der Überprüfung aber nicht standhalten.
Das Video des Vortrags ist hier abzurufen: url.pubiz.de/kriesel
Kommentar hinterlassen zu "Ein Tracking-Lehrstück"