DI045 Daten sehen

Du bist noch kein Abonnent/+?
Hier erfährst Du mehr über
Kuechenstud.io/+
Einloggen

| 17 Kommentare

Michael Kreils Heatmap seiner consolidated.db

Michael Kreil hat die Vorratsdaten des Grünen-Politikers Malte Spitz visualisiert und zuletzt Crowdflow.net initiiert: Über 1000 Menschen haben dort die consolidated.db hoch geladen, jene Standortdaten von WLAN-Stationen und Mobilfunkmasten also, die iPhones ohne das jüngste Update sehr lange speichern. Michael erzählt, wie das Projekt begonnen hat, was man aus den Datenbergen heraus lesen kann und warum das Projekt trotz iOS-Update nicht tot ist. Er hat ein paar wirklich interessante Visualisierungen gemacht. Besonders lehrreich finde ich jene, die anzeigt, welche Standortdaten von WLAN-Stationen und Mobilfunkmasten sich das iPhone wann und wo während einer Fahrt mit der Berliner Ringbahn vom Apple-Server herunter lädt.

Diese mag auf den ersten Blick nicht aussehen, wie ein Thema fürs Medienradio. Aber die Datenberge wachsen in den Himmel und werden immer mehr Informationen, Geschichten und Einsichten über unser Leben enthalten. Diese Schätze zu heben, wird allein mit traditionellen journalistischen Methoden nicht möglich sein. Wir brauchen gute Visualisierungen, Coder, die sie umsetzen und Journalisten, die sowohl die Programmierer, als auch die Daten verstehen. Deswegen habe ich mich entschlossen, nach dem Medienradio über Datenjournalismus hier noch mal einige Aspekte zu vertiefen. Ich hoffe, Ihr nehmt noch ein paar Sachen mit.

Michael Kreil Homepage
Malte Spitz Projekt bei Zeit Online
Deutsche Welle Interview mit Michael Kreil
Breitband faxt Bild (YouTube)
Malte Spitz Homepage
Lorenz Matzat
Medienradio MR043 mit Lorenz Matzat
Screenshot der Excel-Datei der Vorratsdaten von Malte Spitz
IMSI (WP)
IMEI (WP)
Graph der Projektphasen
Outsourcing des Telekom-Billings nach Israel: Artikel, Artikel, Artikel
Crowdflow
WPS (WP)
Screenshots des SQL Lite der consolidated.db
Wie das iPhone nach Mobilfunk-Masten und WLAN-Stationen sucht, Teil 1 (YouTube)
Wie das iPhone nach Mobilfunk-Masten und WLAN-Stationen sucht, Teil 2 (YouTube)
Tolle Visualisierung vom Nachlade-Prozess der consolidated.db
Graph vom Kreis der gesehen Stationen
iPhone Tracker
Heatmap von Michaels consolidated.db
Heatmap der consolidated.db von @gedankenstuecke
Flickr-Feed von Michael Kreil
Graph: Entfernung zweier iPhone-Besitzer
iPhone-Heatmap von Deutschland (10 x consolidated.db)
iPhone-Heatmap von Berlin
Marktverteilung von 150.000 WLAN-Access Points in Berlin
MyData in UK
Torrent der Crowdflow-Datenbank mit rund 700 consolidated.db
EMF-Datenbank der Bundesnetzagentur
Breitbandatlas des Wirtschaftsministeriums
Zementierter unterirdischen Ameisenbau (YouTube)
Spackeria
Ctrl-Verlust
@MichaelKreil

17 Kommentare

  1. Sehr schöne und aufschlußreiche Folge. Danke!

  2. Sehr interessante Folge. Vielen Dank!

    Mir hat der Seitenverweis auf Google Streetview in der Hinsicht gefehlt, dass Google mit den Streetview-Autos auch WLANs aufgezeichnet haben. Das Ziel war das gleiche, das Apple auch verfolgt, nur das Google zu viele Daten gespeichert hat: http://www.heise.de/newsticker/meldung/Datenschuetzer-Street-View-Autos-scannen-private-Funknetze-Update-984118.html

    Der Nebensatz, dass niemand wissen kann, was mit seinen Daten angestellt wird ist richtig und wichtig. Vor einigen Jahren (rund 20) hat die Gruppe “Informatiker für den Frieden” darauf hingewiesen, dass sie nicht wissen können, ob ihre Forschungen auch militärisch ausgewertet werden. Als Beispiel diente eine Mustererkennung, die Schrauben sortieren sollte. Der gleiche Algorithmus kann aber in abgewandelter Form auch als Zielerkennung für Raketen dienen.

  3. 19. Mai 2011 um 07:25 Uhr
    Eener, ders jehört hat

    Zur Schlussfolgerung am Ende der Sendung: Ich finde, ihr habt im zweiten Teil eures Gesprächs nicht nur aufgezeigt, wie viele Informationen über Einzelpersonen durch die Zusammenführung von Daten herauszulesen sind, sondern auch wieviel jeder Einzelne zur Entstehung dieser Daten beiträgt. Es liegt auf der Hand, dass welche Technik wir wie nutzen den entscheidenden Unterschied machen kann, ob eine Information in einer Datensammlung enthalten ist oder nicht. Ich sehe da durchaus Spielräume, die sich aus unserem kulturellen Umgang mit Technologie ergeben. Also ohne Zweifel creepy und Kontrollverlust für den Einzelnen, aber gleichzeitig der Kontrolle durch die Gesellschaft nicht völlig entzogen.

    Der Vollständigkeit halber, vielleicht mal das Experiment mit dem ngram-Viewer von Google Books für das Wort “privacy”:

    http://ngrams.googlelabs.com/graph?content=privacy&year_start=1800&year_end=2000&corpus=0&smoothing=3

    “Privatsphäre”, “Privatheit” gibt es gar nicht erst (kann also nicht relevant sein in Deutschland), also vielleicht mal “privates”:

    http://ngrams.googlelabs.com/graph?content=privates&year_start=1800&year_end=2000&corpus=8&smoothing=3

    Ist ein durchaus interessantes Bild, aber angesichts der Fragen nach der Repräsentativität des Samples von Büchern, die Google gescannt und für den Viewer verwendet hat, nach der Begriffsgeschichte, nach der kulturellen Relevanz (z.B. Größe der Landbevölkerung versus Stadtbevölkerung, Bewusstsein für, Vorkommen von und Zugang zu Datensammlungen) oder nach dem Publikationsumfang für diese Art gesellschaftlicher Themen allgemein, wäre ich vorsichtig daraus Schlüsse zu ziehen. Abgesehen davon, dass ein mentales Konzept von Privatsphäre, die letztlich eine Art Erwartungshaltung darstellt, auch vorhanden sein kann ohne Begriffsbildung und öffentlichen Diskurs. … Dass sich die Leute verstehen und zusammenarbeiten sollen, ist trotzdem ein schöner Gedanke. 😉

    Auch nett, Touristenfotos auf Flickr sind Vorratsdatenspeicherung.
     

    • Aber wie stellst Du Dir einen kulturellen Umgang mit Technik vor, bei dem keine/sehr wenig Daten anfallen, ohne auf alle Vorzuege zu verzichten? Ich habe das Gefühl, der kulturelle Lernprozess sollte sich nicht so sehr auf das Eindämmen der Daten beziehen, als vielmehr auf eine Ethik, wie wir mit der Tatsache umgehen, dass tendenziell alle über alle alles wissen.

  4. 19. Mai 2011 um 11:18 Uhr
    Eener, schon wieder

    Mir geht es weniger um die Quantität der Daten als um die Qualität. Eine Information kann aus einer Datensammlung herausgelesen werden oder nicht. Ich würde das Ganze einfach mal andersherum betrachten. In jeder Sekunde gehen unermesslich viele Informationen über die Welt (auch nur über die menschliche Lebenswelt) verloren, weil sie nicht in irgendeiner Form aufgezeichnet werden. Wir müssen uns bemühen diesem Verlust entgegenzuwirken und wir werden ihn nicht vollständig aufhalten können. Aus dieser Sicht entscheiden wir als Gesellschaft darüber, wie wir unsere begrenzten Ressourcen einsetzen, um Informationen zu sammeln. Und damit natürlich auch darüber, welche Informationen das sind.

    Wenn wir als Individuen zur globalen Datensammlung beitragen, dann wirken unser kultureller Hintergrund und soziale Zusammenhänge stark dabei mit, welche Informationen wir aufzeichnen und was wir damit tun. Ob die Technik, die wir verwenden, Datensammlung unterstützt oder nicht, hängt stark von den Ansprüchen unserer Gesellschaft ab. (Man kann sich ja mal fragen, ob Apple mit “it’s not a bug, it’s a feature” durchgekommen wäre, wenn sie einfach schnell eine Applikation zum komfortablem Management der consolidated.db rübergeschoben hätten.) Für viele der “Vorzüge” benötigt man zum Beispiel gar keine individuellen Daten, sondern es genügen aggregierte oder man benötigt sie nur in kurzen Zeitfenstern. In anderen Fällen ist es tatsächlich eine Abwegungsfrage.

    Über den kulturellen Umgang mit Technik hinaus, stellen sich andere Fragen: Wie wir Menschen beurteilen, die viel oder wenig über sich preisgeben, wie wir mit denen umgehen, die sich in der einen oder anderen Richtung bemühen, oder wieviel Preisgabe wir für gesellschaftliche Partizipation voraussetzen. Datensparsamkeit ist ähnlich wie politisches Engagement oder Umweltbewusstsein nicht sinnlos, solange man nicht der einzige ist der sie praktiziert oder für ein sinnvolles Ziel hält.

    Will also letztlich nur sagen, ich sehe durchaus Spielräume. Man kann sich sicherlich darüber streiten, wie groß die wirklich sind.

    Übrigens funktioniert deine Prämisse so glaube ich nicht. Dass alle alles über alle wissen, dazu wird es, auch tendenziell, aufgrund unserer biologischen Beschränktheit nicht kommen. Die Frage sollte eher lauten, wie entwickelt sich die Gesellschaft, wenn jedes Individuum die Erwartung haben muss, dass jedes Gegenüber in einer Kommunikation potentiell Zugriff auf eine große Menge an (wahren und falschen) Informationen über die eigene Person besitzt bzw. sich diesen innerhalb kurzer Zeit verschaffen kann. Oder etwas knackiger, welche ethischen Fragen stellen sich in einer Gesellschaft, in der für alle Mitglieder eine fundamentale Unsicherheit über die Bekanntheit der eigenen Person und Lebensumstände herrscht.

    Kann man ja mal einen Promi danach fragen…

    • Richtige Einwände. Sie laufen aber alle darauf hinaus: Wie sparsam wir auch sind mit unseren Daten, wie restriktiv die Nutzung gesammelter Daten auch geregelt ist – können wir wirklich noch abschätzen, was unser Gegenüber (Staat, Unternehmen, Familie, Freunde) über uns wissen? Ich glaube, das wird immer schwieriger und geht tendenziell gegen nein. Dann fragt sicher, was mit dem Diktum des BVG aus dem Volkszählungsurteil ist, das sinngemäß ja besagt: Wenn Bürger nicht abschätzen können, was der Staat über sie weiß, ist ihre Teilhabe am demokratisch-gesellschaftlichen Prozess behindert/nicht mehr möglich. Gilt das noch? Ist das wirklich so? Wenn ja: Wie soll unsere Demokratie funktionieren, wenn keiner mehr wirklich wissen kann, was seinen Gegenüber über ihn weiß?

      • Also es lohnt sich auf jeden Fall das Szenario mal zu durchdenken. Ganz so leicht ist das aber nicht.

        Ich denke das Verfassungsgericht ging in seinem Urteil unter anderem von der Machtasymmetrie zwischen Bürger und Staat aus. Die erste Frage wäre, ob diese Asymmetrie verschwindet, wenn dieser postulierte Zustand der informationellen Unsicherheit herrscht. Werden die Vertreter des Staates in der gleichen Unsicherheit leben wie alle anderen auch? Gesetzt dem Fall es wäre so, würde das bedeuten, dass ich deshalb gegenüber dem Staat an Macht gewinne? Eine verwandte Frage ist, ob man sich mehr Sicherheit kaufen kann, mit anderen Worten kann ich Geld ausgeben und dann die realistische Erwartung haben, dass bestimmte Informationen über mich verschwinden? Sagen wir mal, die Machtasymmetrie würde tatsächlich aufgehoben, dann wäre sicherlich eine der Grundlagen für das Urteil abgeschwächt. Denn wenn man bei Angst vor Beobachtung abweichendes Verhalten einstellt, wie vom Verfassungsgericht vermutet, dann auch deshalb, weil man Sanktionierung fürchtet.

        Die zweite Frage wäre, verstehst du unter informationeller Unsicherheit (ich nenne es mal weiter so) das Verschwinden aller unbeobachteten Räume? Ein Beispiel, ich treffe mich mit einer anderen Person. Durch unsere Mobilgeräte ist der Ort und die Dauer des Treffens nachvollziehbar, genauso wie alle Informationen, die wir an dem Ort abrufen. Unsere politische Ausrichtung und Beziehung zueinander ist wiederum durch unsere sonstigen Onlineaktivitäten nachvollziehbar. Etwaige Kontenbewegungen, die von dort initiiert werden, sind es auch. Setzen wir weiter voraus, dass all diese Daten für jeden abrufbar sind und dass wir keine andere Wahl haben als sie zu erzeugen, dass ist ja eigentlich die zentrale Prämisse. Trotz all dieser Umstände – und die Nähe, die die Daten erzeugen, fühlt sich ohne Zweifel sehr bedrückend an – könnten wir am Ort des Geschehens dennoch eine Situation des Unbeobachtetseins vorfinden und so wir einander vertrauen, darauf zählen, dass das tatsächliche Geschehen am Ort unter uns bleibt. Oder nicht? — An der Stelle sollte man kurz darauf kommen, warum die Möglichkeit für abweichendes Verhalten überhaupt so wichtig ist. Ich denke, es geht darum, dass verhindert werden soll, dass der Staat oder andere gesellschaftliche Gruppen ausgestattet mit Sanktionsmacht durch die Transparenz der Opposition unmittelbar auf alles reagieren können, was sich an Gegenmeinung erst organisieren muss. Dadurch kann auch in einer obflächlich demokratischen Gesellschaft Meinungsbildung unterbunden werden. — Wenn aber trotz informationeller Unsicherheit unbeobachtete Freiräume bestehen bleiben, bleibt abweichendes Verhalten im gewissen Rahmen weiterhin möglich.

  5. Pingback: Glanzlichter 66 « … Kaffee bei mir?

  6. Pingback: WMR23 – Mit CDU-Tassen gegen den Staat! » Wir. Müssen Reden

  7. Wer mal sehen will, wie die Visualisierungstools von Ermittlungsbehörden aussehen:

    http://www.geotime.com/Product/GeoTime-%281%29/Demos-%281%29/Demos-%285%29.aspx

  8. Eine hochinteressante Sendung. Danke dafür.
    Wirklich interessant zu sehen, wie und in welcher Form diese Kommunikationsdaten gespeichert werden. Klar, das dies per technischer Notwendigkeit in irgendeiner Form so sein muss, jedoch im Zuge der ja momentan ausgesetzten Vds ein wirklich nahebringendes Projekt um auch den letzten Zweifler mal ein wenig vor Augen zu führen wieviel Missbrauch damit möglich ist und ja auch praktiziert wird.
    Leider finde ich, wissen gerade das viel zu wenig Leute, ich sprehe mal von den “Normalos” was technisch möglich ist.
    Sofern die Bewegungsdaten rein zum technischen Zweck verwendet werden und nicht gespeichert werden ist es sicherlich in Ordnung,
    Ermittlungsbehörden und Geheimdienste haben ja per se über die bekannten Li Schnittstellen ohnehin Zugriff und noch viel weitreichenderen Zugriff.
    Das Projekt finde ich dennoch sehr tiefgehend und vielleicht regt es ja auch einige dazu an drüber nachzudenken, welche Folgen das Ganze hat und immer wieder haben wird.

    Die technischen Möglochkeiten zur Vollüberwachung wird es immer geben. Es kommt wohl auch mehr darauf an nicht die Technologie zu verteufeln sondern bewusst damit umzugehen. Jedoch müssen sich sowohl die Telcos (die sich ja gern mit der Darstellung einer gesetzlichen Umsetzung aus der Verantwortung ziehen) als auch die Hardwarehersteller vielleicht auch dazu bewegen lassen generell auch Schnittstellen zur Überwachung zu verzichten.

    Gerade zu diesem Thema lohnt sich auch echt ein Blick in das Buch 1984.exe oder in eine Chaosradio Sendung zur Gsm Security.

    Jedenfalls hat mir die Sendung sehr gut gefallen, das Gespräch hat sich über die gesamte Zeit sehr intensiviert.

    Vielen Dank nochmal.

  9. Sorry, hatte ihn vergessen frei zu schalten. Sehr interessant.

  10. Pingback: nrrrdz000013: kollaboratives / i heart digital life

  11. Pingback: German journalists add a visual twist to cellphone data | Journalism Tech

  12. Pingback: Podcast Empfehlung #1: Medienradio. | lemontreepresse

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.