Zum Hauptinhalt springen

Schlüsselvariable

Schlüsselvariablen stellen den entscheidenden Link bereit, der es Angreifer:innen erlaubt, eine Zielperson in einem anonymisierten Mobilitätsdatensatz zu identifizieren. Es handelt sich hier um Variablen, die sowohl in dem Mobilitätsdatensatz als auch in anderen verfügbaren Datensätzen oder im Hintergrundwissen der Angreifer:innen enthalten sind. Durch den Vergleich der Werte, die in dem Mobilitätsdatensatz und anderen Datensätzen in den Schlüsselvariablen gespeichert sind, können Angreifer:innen Datensubjekte identifizieren. Dazu muss die Kodierung der Schlüsselvariablen im Angriffs- und Zieldatensatz gleich (oder zumindest harmonisierbar sein).

Im Wesentlichen gibt es vier Quellen für Hilfsinformationen:

  1. Datensätze, die dieselben Informationen für dieselbe (oder eine hinreichend ähnliche) Population enthalten,
  2. Informationen, die öffentlich zugänglich sind (z. B. in öffentlichen Registern oder in sozialen Medien),
  3. Informationen, die aus lokalem Wissen gewonnen werden (z. B. der Wohnort, der durch physische Beobachtung gewonnen wird), und
  4. Informationen, die durch persönliches Wissen gewonnen werden (z. B. Dinge, die ich über meine Nachbar:innen oder Arbeitskolleg:innen weiß).

Natürlich gibt es terminologische Überschneidungen zwischen dem Begriff der Schlüsselvariablen und dem des indirekten Identifikators. Der Unterschied besteht darin, dass eine Schlüsselvariable spezifisch für ein bestimmtes Szenario ist (z. B. eine bestimmte Kombination von Datensätzen), während sich der Begriff des indirekten Identifikators auf den Datensatz selbst konzentriert und darauf, welche Variablen in jedem Szenario als Identifikatoren verwendet werden können. Die Menge der indirekten Identifikatoren ist also die Menge aller möglichen Schlüsselvariablen für alle möglichen Szenarien. Aber - und das ist entscheidend - man wird nur sehr selten (wenn überhaupt) auf eine Situation stoßen, in der man alle potenziellen indirekten Identifikatoren gleichzeitig in Betracht zieht, da die meisten Szenarien nur eine Teilmenge - die Schlüsselvariablen für dieses Szenario - umfassen. Häufige Schlüsselvariablen sind beispielsweise Alter, Geschlecht, Adresse, Beziehungsstatus, Wohnort, Arbeitsort. Jedoch hängen die Schlüsselvariablen auch von dem Kontext der Daten ab.

Schlüsselvariablen erhöhen das Privatsphärerisiko für die Datensubjekte und sollten daher als solche markiert werden. Falls nicht bekannt ist welche genauen Datensätze Angreifer:innen besitzen, wird jede Variable als Schlüsselvariable angesehen, die Informationen enthält, die für die Angreifer:innen wahrscheinlich verfügbar ist und potentiell eine Verknüpfung mit weiteren Datensätzen zulässt.

Das ADF stellt für verschiedene Szenarien eine Liste von Standard-Schlüsselvariablen zusammen: ADF Companion Document A