Eine anonymisierte Datenbank soll einerseits keine datenschutzrechtlich bedenklichen Daten enthalten, andererseits in einem Zustand sein, der möglichst nahe an die Produktiv-Datenbank herankommt. Nur so kann sie vernünftig für weitere Zwecke (Testumgebung, Schulung, Support) weiterverwendet werden.
Das Anonymisierungsskript versucht, beide Ziele miteinander zu verknüpfen, wobei im Zweifelsfall der Datenschutz Vorrang hat.


Umsetzung

Tabellen, für die eine Anonymisierung zu aufwendig wäre bzw. die nach einer Anonymisierung nicht mehr nutzbar wären, werden geleert. Das gilt insbesondere für das interne Log und die Dokumenten-Reiter.
Felder, bei denen der Nutzer nur vorgegebene Werte auswählen kann, werden nicht verändert. Damit können Auswertungen weiterhin mit realistischen Daten getestet werden. Betroffen hiervon sind Listen, Checkboxen und Verknüpfungen zu anderen Datensätzen.

Nicht anonymisiert werden weiterhin folgende Informationen:

  • Login der Benutzer
  • Angaben zu PLZ und Ort
  • Bezeichnung von Firmen und Institutionen
  • Bezeichnungen von Projekten in der PROJEKTbox

Da die Arbeit mit der Datenbank massiv erschwert wird, wenn die Bezeichnung der Datensätze unlesbar oder unsinnig ist, werden Namen gesondert behandelt. Das Skript vergibt bei allen Datensätzen neue Vor- und Nachnamen sofern die entsprechenden Felder gefüllt waren.

Sofern das Skript das Geschlecht eines Datensatzes erkennen kann, vergibt es Vornamen, die zu diesem Geschlecht passen, ansonsten wird ein zufälliger Vorname vergeben. Das Skript orientiert sich dabei ausschließlich an den Einträgen im Feld „Geschlecht“ oder „Anrede“ des Datensatzes. Sollten sich in einem Datensatz die Namen mehrerer Personen befinden, werden diese also alle derselben Geschlechts-Kategorie zugeordnet.

Bei den zur Verfügung stehenden Namen bedient sich das Skript der vorhandenen Namen aus der Datenbank. Dabei werden Namen, die in der Datenbank (unter Beachtung des Geschlechts) einmalig sind, ignoriert. Haben Sie also einen männlichen Kari und zwei weibliche Kari in der Datenbank, wird das Skript den Namen Kari bei Datensätzen von männlichen Personen nicht vergeben, wohl aber bei weiblichen und undefinierten Datensätzen.

Termine erhalten die Bezeichnung „Termin “ gefolgt von der internen Nummer des Termins. Alle weiteren ausgefüllten Felder, in denen Benutzer manuelle Text eingeben können, werden, je nach Konfiguration, entweder mit einem „x“ gekennzeichnet oder durch einen Blindtext (Lorem ipsum …) ersetzt. Die Felder „Erfassung durch“ und „Letzte Änderung durch“ werden entweder gelöscht, mit einem „x“ gekennzeichnet oder mit zufälligen Namen der (anonymisierten) Mitarbeiter-Datensätze gefüllt.


Durchführung

  1. Stellen Sie das Datenbank-Backup wieder her. Der Name der Datenbank muss auf _anon enden.
  2. Vergewissern Sie sich, dass niemand in synCase arbeitet. Es könnte sonst passieren, dass die angemeldeten Benutzer versehentlich auf der falschen Datenbank landen.
  3. Klicken Sie in synCase auf Datenquelle -> öffnen


  4. Klicken Sie nun auf den “Neu“-Button, um einen neuen Eintrag mit dem Anfangskatalog der neuen Datenbank zu erstellen.

  5. Sie werden aufgefordert, einen Namen für die neue Verbindung anzugeben. Die Bezeichnung spielt für die Anonymisierung keine Rolle und kann beliebig gewählt werden.

  6. Für die Spalten „Datenbank“ und „Quelle“ übernehmen Sie die Daten der Produktivdatenbank. Um die Zellen bearbeiten zu können, klicken Sie in die zu bearbeitende Zelle (schwarzer Rahmen) und dann auf den Bearbeitungs-Button.


  7. Erst jetzt können Sie etwas auswählen bzw. eintragen. In der Spalte „Anfangskatalog“ fügen Sie den Anfangskatalog der neuen Datenbank ein. Beachten Sie, dass der Anfangskatalog auf „_anon“ enden muss. Andernfalls wird das Anonymisierungsskript abgebrochen.
  8. Diese Datenbank öffnen und das Anonymisierungsskript über „globale Aktionen“ aufrufen.


  9. Nach Beendigung des Skriptes wieder „Datenquelle öffnen“ wählen, den neuen Eintrag entfernen und in der Echt-Datenbank anmelden. Danach kann synCase wieder geschlossen werden und die Benutzer können wieder damit arbeiten.
  10. Erstellen Sie ein Backup der „_anon„-Datenbank und schicken Sie es uns zu, sofern notwendig.