Themenüberblick

Daten schreddern mit Facebook

Soziale Netzwerke wie Facebook und Google+ setzen auf riesigen Datenbanksystemen auf. Mit dem schnellen Wachstum dieser Dienste wird das Löschen von Beiträgen und Nutzerkonten auch zum technischen Problem. Daten, die der User für gelöscht hält, können durchaus noch länger im System bleiben.

Wenn ein Anwender auf seinem PC eine Datei löscht, dann ist sie damit bekanntlich nicht verloren. Das Betriebssystem gibt nur den Platz auf dem Datenträger frei, und die Datei bleibt so lange voll intakt, bis sie von neueren Informationen überschrieben wird.

Daher ist es möglich, Dateien, die noch nicht vor zu langer Zeit gelöscht worden sind, mit Hilfe von Spezialsoftware wiederherzustellen. Um eine Datei wirklich löschen zu können, muss sie mit anderen Daten überschrieben werden, am besten gleich mehrmals. Und auch dann können Experten mit Spezialwerkzeugen noch viele Informationen rekonstruieren.

Gelöscht und doch vorhanden

Schon auf einem herkömmlichen PC ist es nicht einfach, Daten wirklich zu löschen. Das gilt auch für die großen Rechnersysteme der Sozialen Netzwerke, in denen zunehmend viele Details aus dem Leben aller Bürger aufgezeichnet werden. Auf Google+ kann es beispielsweise ab und zu vorkommen, dass der Nutzer noch über Reaktionen anderer Teilnehmer zu einem eigenen Kommentar informiert wird, den er selbst vor kurzem erst entfernt hat.

Als sich die Wiener Studentengruppe um Max Schrems alle Daten zusenden ließ, die Facebook über sie gespeichert hatte, war sie erstaunt darüber, in dem Konvolut auch Informationen verschiedenster Art wiederzufinden, die sie entfernt zu haben glaubte. Sie waren in der Datenbank als „gelöscht“ markiert, blieben aber noch weiterhin gespeichert.

Datenbankexpertin Ivona Brandic

ORF.at/Günter Hack

Ivona Brandic, Expertin für Datenbanken und verteilte Systeme an der TU Wien

Unterbrochene Verbindungen

„Dass die Daten für den Nutzer verschwunden sind, heißt noch lange nicht, dass sie auch gelöscht wurden“, so Ivona Brandic, Expertin für Rechenzentren und verteilte Datenbanksysteme an der TU Wien, im Gespräch mit ORF.at. „Unter Löschen verstehen die Betreiber vielleicht, dass der direkte Link von bestimmten Daten zu einem bestimmten Nutzer unterbrochen wird. Dass man dann nicht mehr sagen kann, von wem sie gespeichert worden sind. Man kann diese anonymisierten Daten aber sehr wohl für andere Zwecke benutzen.“

Große Datenbanken sind komplexe technische Systeme. Und damit nicht genug: Sie sind heute auch oft über mehrere Datencenter auf verschiedenen Kontinenten verteilt, in denen die Datensätze in mehreren Kopien gespeichert sind.

Neue Datenbanken

Facebook etwa betreibt zwei Datenzentren in den USA, baut eines in Schweden und setzt bei der Datenbanksoftware unter anderem sowohl das bewährte System MySQL als auch das modernere Apache Cassandra ein. MySQL ist eine klassische relationale Datenbank, in der die Datensätze in Tabellen gespeichert werden, die miteinander in Relation gebracht, also verknüpft und mit Befehlen aus der Datenbanksprache Structured Query Language (SQL) abgefragt werden können.

Bei dem ursprünglich von Facebook-Mitarbeitern entwickelten Cassandra handelt es sich dagegen um ein NoSQL-System, in dem die Daten auch in Tabellen gespeichert werden, das aber leichter im Betrieb um neue Attribute erweitert und auch schneller um neue Rechner im Verbund ergänzt werden kann - Fachleute sprechen hier von „Skalierung“. MySQL und Cassandra haben jeweils ihre eigenen Vor- und Nachteile.

Wachstum als Problem

„Die relationalen Datenbanken ermöglichen sehr saubere Datenspeicherungen und Transaktionen“, erläutert Brandic. „Sie sorgen dafür, dass die Daten konsistent bleiben. Diese Sauberkeit geht aber auf Kosten von Skalierbarkeit und Leistungsfähigkeit. Das heißt, sie sind für Social Networks, wo sehr viele verschiedene Daten anfallen und schnell neue Rechner dazugeschaltet werden müssen, eher nicht so gut geeignet. Deshalb gibt es in letzter Zeit den Trend, diese NoSQL-Datenbanken zu nutzen.“ Auch der Kurznachrichtendienst Twitter und die Social-News-Plattform Reddit nutzen Cassandra.

Der Einsatz verschiedener Systeme sowie die ausfallsichere Speicherung der Daten über mehrere verschiedene Computer oder gar Rechenzentren hinweg machen es den Betreibern nicht einfach, ihren Löschpflichten nachzukommen - zumal in ihrer kommerziellen Betriebslogik der Anreiz dazu fehlt. „In solchen Datenbanken ist das Löschen kompliziert“, so Brandic, „die Firmen werden es uns auch nicht leicht machen, unsere Daten zu löschen. Warum sollten sie auch? Wir benutzen Facebook und Google+ gratis. Wir zahlen für ihre Dienste mit unserer Privatsphäre.“

Komplexe Plattformen

Soziale Netzwerke wie Facebook wachsen schnell, erfinden neue Funktionen für Nutzer und Werber, kaufen Dienste zu und müssen diese integrieren. Auch das macht beim Löschen Probleme. „Facebook hat uns gesagt, dass ihre Verknüpfungen im System oft nur in eine Richtung funktionieren. Ein Posting, das ein Nutzer in einer Gruppe gemacht hat, linkt zwar zu dessen Profil, aber das Profil linkt nicht zum Posting zurück“, erläutert Max Schrems von Europe-v-Facebook.org. „Wenn man das Profil löscht, finden Sie also das Posting in der Gruppe nicht mehr. Das wäre aber leicht zu reparieren.“

In ihrem ersten Bericht zu den Beschwerden der Wiener Studenten hat die zuständige irische Datenschutzbehörde Facebook dazu ermahnt, den Nutzern mehr Kontrolle über die Löschung ihrer verschiedenen Beiträge und Aktionen wie Freundschaftsanfragen und Stupser (Pokes) zu geben. Europe-v-Facebook.org konnte in Erfahrung bringen, dass Direktnachrichten und Chatbeiträge zum Zeitpunkt der Anfrage im vergangenen Jahr gar nicht gelöscht werden können.

Facebooks neue Richtlinien

Gegen Ende des ersten Quartals 2012, so Facebooks Selbstverpflichtung damals, wollte das Soziale Netzwerk entsprechende Kontrollmechanismen fertig eingebaut haben und die User in einer überarbeiteten Fassung seiner Datennutzungsrichtlinie über Speicherarten und -fristen genauer informieren.

Diese Nutzungsbedingungen (Data Use Policy) und -richtlinien (Erklärung der Rechte und Pflichten) sind am 15. März von Facebook veröffentlicht und zur Diskussion gestellt worden. Belastbare Aussagen zu den Löschfristen gibt es darin allerdings nur die endgültige Schließung des Accounts betreffend.

Verschiedene Fristen

Bis zu 90 Tage kann es demnach dauern, so Facebook, bis ein Profil inklusive Backups tatsächlich aus den Systemen gelöscht ist. Zu den Löschfristen für einzelne Postings oder Stupser macht das Netzwerk derzeit noch keine Angaben. In den „Rechten und Pflichten“ heißt es nur, dass die Löschung von Beiträgen ähnlich ablaufe wie bei der Leerung des virtuellen Papierkorbs auf dem Computer-Desktop. „Allerdings sollte dir bewusst sein, dass entfernte Inhalte für eine angemessene Zeitspanne in Sicherheitskopien fortbestehen (die für andere jedoch nicht zugänglich sind)“, heißt es weiter.

Googles Social Network Google+ läuft, wie viele andere Dienste des Konzerns auch, auf dem selbst entwickelten Datenbanksystem Big Table, das in seinen Eigenschaften Apache Cassandra ähnelt. Laut Auskunft des Unternehmens gegenüber ORF.at gilt sowohl für Postings als auch für ganze Accounts eine Löschfrist von 60 Tagen. Schon vorher, sofort nachdem der Nutzer auf „Löschen“ geklickt habe, nutze man die entsprechend gekennzeichneten Inhalte nicht mehr für das hauseigene System zur Auslieferung gezielter Werbung.

Strenges Österreich

In Österreich muss ein Betreiber dem Löschantrag eines Nutzers innerhalb von acht Wochen nachgekommen sein. Im April 2010 hat der Oberste Gerichtshof entschieden, dass eine bloße Sperrung von Inhalten einer Datenbank nicht ausreicht, um der Löschpflicht nachzukommen (Geschäftszahl 6Ob41/10p). Laut irischem Datenschutzrecht, das für Facebook gilt, da der Konzern in Dublin seine Europa-Niederlassung betreibt, reicht bereits die Sperrung der Daten aus, diese muss allerdings schon nach 40 Tagen erfolgt sein.

Die laxere irische Interpretation der Lösch- und Korrekturpflicht ist mit der geltenden EU-Datenschutzrichtlinie konform. Im neuen Vorschlag der EU-Kommission zu einer Datenschutzgrundverordnung wurde ausdrücklich auf den vagen Ausdruck „Sperren“ verzichtet. Wenn ein Nutzer seine Daten entfernt haben möchte, ist nun ausdrücklich von „Löschen“ die Rede. Die Fristen und weitere Details dazu möchte die Kommission allerdings im Rahmen „delegierter Rechtsakte“ präzisieren (Artikel 17 Abs. 9). Ob diese Vorschläge die Zustimmung von EU-Ministerrat und -Parlament finden werden, ist keineswegs sicher.

Metadaten als Problem

Wenn ein Facebook-Nutzer einen Beitrag schreibt und sendet, dann wird nicht nur dieser allein gespeichert, sondern auch eine Menge anderer Daten, beispielsweise von wo oder um welche Zeit der User seine Meldung abgeschickt hat - wertvolle Informationen, auch für Werber. Brandic: „Es geht auch um Daten über Daten, also Metadaten. Welche dieser Metadaten sind es wert, sie sicher abzuspeichern? Wo ist die Grenze? Wo hören meine Daten auf? Gehören sie mir oder dem Betreiber? Müssen sie auch gelöscht werden? Es ist auch für mich nicht einfach, diese Grenze zu ziehen. Da ist der Gesetzgeber gefordert.“

Der Wiener Anwalt und Experte für Datenschutzrecht, Rainer Knyrim, sieht die Rechte für die Metadaten eher beim User als beim Plattformbetreiber. „Ausjudiziert und zu Ende diskutiert ist dieses Thema aber noch nicht“, so Knyrim gegenüber ORF.at.

Feedback zwischen Staat und Technik

Brandic wünscht sich, dass der Dialog zwischen Politik und Informatik verbessert und beschleunigt wird, um die gesetzlichen Rahmenbedingungen und technische Möglichkeiten einander besser anpassen zu können: „Es ist schwer vorherzusehen, wie sich die Technik weiterentwickelt. Hätten Sie vor 20 Jahren gewusst, wie das Leben mit Internet heute aussieht? Wichtig ist, dass es eine Rückkopplung mit der Politik gibt, in einer effizienteren Art, als das heute der Fall ist.“

Flankiert werden sollte das durch eine Initiative im Bildungsbereich, schlägt die Expertin vor. „Viele Benutzer wissen nicht, welche Auswirkungen ihre Aktionen in Sozialen Netzwerken vielleicht in einigen Jahren haben werden“, so Brandic. „Wenn es im Internet ist, dann ist es draußen. Es sollte eine Art Ethikunterricht für Onlinewelten in Schulen geben. Es ist ja cool und lustig, sich auf Facebook zu bewegen, aber man muss ein Bewusstsein dafür entwickeln, dass meine Beiträge auch dann noch dort stehen können, wenn es mir nicht mehr passt.“

Günter Hack, ORF.at

Links: