Geschichten in Daten finden

image

Die digitalen Spuren, die wir täglich hinterlassen, erzählen Geschichten. Über unseren Musikgeschmack, wohin wir reisen, was uns bewegt: All das scheint für immer in der digitalen Welt an Datenmengen verloren. Eine Übersicht kann man sich nur verschaffen, indem man gezielt nach Begriffen sucht.  Auch in diesen scheinbar belanglosen Alltagsinformationen lassen sich Muster und Algorithmen erkennen, die dazu dienen, Geschichten zu erzählen und Fragen zu beantworten. Wie aber findet man Geschichten in Datenstrukturen?

Daten in Geschichten verpacken

Als Neuling im Datenjournalismus hat man meistens den Eindruck, dass es dabei hauptsächlich um die Präsentation von Datensystemen geht – beispielsweise Visualisierungen, die einen raschen Überblick über die präsentierten Zahlen vermitteln, oder interaktive, durchsuchbare Datenbanken, die den Nutzern die Möglichkeit zur personalisierten Suche geben. Das alles erscheint sehr nützlich, jedoch sollte Datenjournalismus auch die Essenz des Journalismus, nämlich Geschichten, enthalten.  Eine Datenjournalismus-Geschichte sollte es dem Leser ermöglichen, sie zu lesen, ohne über die beschriebenen Datenmengen Bescheid zu wissen. 

Als Beispiel dafür ist ein Projekt des Bureau of Investigative Journalism zu nennen, welches für eine Arbeit das Finanztransparenz-System der EU heranzieht. 

 Caelainn Barr, die als Datenjournalistin an dem Projekt beteiligt war, beschreibt die Arbeitsprozesse folgendermaßen:

„Die Geschichte entstand, indem der Datensatz auf Basis von speziellen Anfragen durchforstet wurde, beispielsweise „Cocktail“, „Golf“ und „Urlaubstage“. Das half uns zu bestimmen, wie viel die Kommission für diese Dinge aufwendet. Daraus entstanden für uns weitere Fragen und Storylines.

Schlüsselbegriffe führen jedoch manchmal nicht zu dem, was man eigentlich will. Während dieses Projekts wollten wir herausfinden, wie viel EU-Kommissionäre für Reisen mit dem Privatflugzeug ausgeben. Die Datenbank enthielt jedoch nicht den Suchbegriff „Privatflugzeug“, deswegen mussten wir zuerst den Reiseanbeiter finden, der den Namen „Abelag“ trug. So konnten wir die Datenbank dann auf „Abelag“ durchsuchen, um herauszufinden wie viel für die von dem Anbieter gebotenen Services ausgegeben wurde. Durch diesen Ansatz hatten wir ein klar definiertes Ziel für unsere Datenanfragen generiert, das auch als Schlagzeile geeignet war.

Ein weiterer Ansatz ist die Erstellung einer schwarzen Liste und die diesbezügliche Suche von Ausnahmen. Ein einfacher Weg, Handlungsstränge aus Datensätzen zu bekommen ist, zu wissen, was man darin nicht finden sollte.“

(Quelle: The Data Journalism Handbook: Data Stories, S.159)

image

Screenshot der Homepage des EU-Finanztransparenzsystems

Man weiß nie, was man in einem Datensatz findet. Eine Annäherung kann gelingen, indem man versucht, offensichtliche Charakteristiken herauszufinden, die sich durch Herausfiltern zeigen, beispielsweise durch die Suche nach Extremen.

Personalisierung

Die Herausforderung dabei sollte immer sein, Geschichten aus Daten zu erschaffen, an denen ein großes öffentliches Interesse besteht, zu denen man als Privatperson aber keinen Zugang hat.

Mirko Lorenz, Begründer des Open-Source-Datenvisualisierungsprogramms „DataWrapper“, erklärt die Personalisierungsnotwendigkeit:

„Wir wollen uns unter den unvorstellbaren Zahlenmengen, die wir jeden Tag in den Nachrichten hören, etwas vorstellen können; erkennen, was die Millionen und Billionen für jeden von uns bedeuten.“

(Quelle: The Data Journalism Handbook: Chapter 2: In The Newsroom, S.60)

Daten extrahieren

Worin genau liegt jetzt das journalistische Interesse in alldem? Geschichten in Datenstrukturen finden ist eine traditionelle Definition von Datenjournalismus. Verbirgt sich eine Exklusiv-Geschichte in der Datenbank? Sind die Angaben und Darstellungen akkurat? Beweisen oder widerlegen sie ein Problem? All das sind Fragen, die sich Daten-Journalisten oder Computer-Assisted-Reporter stellen müssen. Die meiste Zeit verbringt man als Datenjournalist mit dem Durchkämmen von massiven Datenmengen, in der Hoffnung etwas Bemerkenswerktes zu finden.

„Die Motivation sollte immer der Effekt sein; auf das Leben der Menschen, auf die Gesetzgebung,auf das Verantwortungsbewusstsein der Politiker. (…) Unsere Arbeit lebt, wenn sie einem Leser dabei hillft, seine eigene Geschichte in den Daten zu finden.“ – Brian Boyer, Chicago Tribune

(Quelle: The Data Journalism Handbook: Chapter 2: In The Newsroom, S. 34)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

13 + 6 =