Skript zur Anonymisierung von Postfix Logdateien
![](https://secure.gravatar.com/avatar/be7522b29c78110a2e9e92d73c91aa1a.jpg?s=120&d=mm&r=g)
Gibt es ein fertiges Skript, um Postfix Logdateien (/var/log/mail) so zu anonymisieren, daß so eine Datei bedenkenlos für Auswertungszwecke weitergegeben werden kann? Es müssen alle Mailadressen, IP-Adressen und Hostnamen so umgesetzt werden, daß keinerlei Rückschlüsse auf die Originaldaten mehr möglich sind. Ein Hash ist IMO nicht ausreichend, da es möglich ist, bei bekannter Hashfunktion für lokale Mailadressen die Hashes zu berechnen und dann mit den anonymisierten Daten zu vergleichen. Lokale Mailadressen sind vom Campus aus via LDAP abrufbar.
Meine Idee wäre, für eine Logdatei z.B. alle Local Parts (links vom @) und alle Domain Parts (rechts vom @) in Arrays einzulesen und dann nur den Index zu verwenden, also localpart12345@domainpart54321.
Vielleicht hat schon jemand so etwas fertig, ansonsten muss ich mir selber was schreiben.
![](https://secure.gravatar.com/avatar/20b4a10f669de9150a92e3012c389289.jpg?s=120&d=mm&r=g)
* Peter Heitzer Peter.Heitzer@rz.uni-regensburg.de:
Gibt es ein fertiges Skript, um Postfix Logdateien (/var/log/mail) so zu anonymisieren, daß so eine Datei bedenkenlos für Auswertungszwecke weitergegeben werden kann? Es müssen alle Mailadressen, IP-Adressen und Hostnamen so umgesetzt werden, daß keinerlei Rückschlüsse auf die Originaldaten mehr möglich sind. Ein Hash ist IMO nicht ausreichend, da es möglich ist, bei bekannter Hashfunktion für lokale Mailadressen die Hashes zu berechnen und dann mit den anonymisierten Daten zu vergleichen. Lokale Mailadressen sind vom Campus aus via LDAP abrufbar.
Meine Idee wäre, für eine Logdatei z.B. alle Local Parts (links vom @) und alle Domain Parts (rechts vom @) in Arrays einzulesen und dann nur den Index zu verwenden, also localpart12345@domainpart54321.
Vielleicht hat schon jemand so etwas fertig, ansonsten muss ich mir selber was schreiben.
Tadaaaa! https://github.com/sys4/loganon
p@rick
![](https://secure.gravatar.com/avatar/be7522b29c78110a2e9e92d73c91aa1a.jpg?s=120&d=mm&r=g)
On 03/03/2016 at 13:08, Patrick Ben Koetter p@sys4.de wrote:
- Peter Heitzer Peter.Heitzer@rz.uni-regensburg.de:
Gibt es ein fertiges Skript, um Postfix Logdateien (/var/log/mail) so zu anonymisieren, daß so eine Datei bedenkenlos für Auswertungszwecke weitergegeben werden kann? Es müssen alle Mailadressen, IP-Adressen und Hostnamen so umgesetzt werden,
daß
keinerlei Rückschlüsse auf die Originaldaten mehr möglich sind. Ein Hash ist IMO nicht ausreichend, da es möglich ist, bei bekannter Hashfunktion für lokale Mailadressen die Hashes zu berechnen und dann mit den anonymisierten Daten zu vergleichen. Lokale Mailadressen sind vom Campus aus via LDAP abrufbar.
Meine Idee wäre, für eine Logdatei z.B. alle Local Parts (links vom @) und alle Domain Parts (rechts vom @) in Arrays einzulesen und dann nur den Index zu verwenden, also localpart12345@domainpart54321.
Vielleicht hat schon jemand so etwas fertig, ansonsten muss ich mir selber
was
schreiben.
Tadaaaa! https://github.com/sys4/loganon
Ist für den Zweck leider nicht geeignet, da es jede Logdatei für sich anonymisiert. Für den Empfänger der anonymisierten Daten ist eine zeitliche Konstanz notwendig, d.h. vornamex.nachnamey@domain muss dauerhaft auf z.B. mailadresse4711 umgesetzt werden. Ich werde mir selber was schreiben, was jede neue Mailadresse in eine Datenbankzeile einträgt und mit einer laufenden Nummer versieht. Damit hat jede Adresse eine eindeutige ID und kann ohne Zugriff auf die Datenbank auch nicht rückgewandelt werden.
![](https://secure.gravatar.com/avatar/20b4a10f669de9150a92e3012c389289.jpg?s=120&d=mm&r=g)
* Peter Heitzer Peter.Heitzer@rz.uni-regensburg.de:
On 03/03/2016 at 13:08, Patrick Ben Koetter p@sys4.de wrote:
- Peter Heitzer Peter.Heitzer@rz.uni-regensburg.de:
Gibt es ein fertiges Skript, um Postfix Logdateien (/var/log/mail) so zu anonymisieren, daß so eine Datei bedenkenlos für Auswertungszwecke weitergegeben werden kann? Es müssen alle Mailadressen, IP-Adressen und Hostnamen so umgesetzt werden,
daß
keinerlei Rückschlüsse auf die Originaldaten mehr möglich sind. Ein Hash ist IMO nicht ausreichend, da es möglich ist, bei bekannter Hashfunktion für lokale Mailadressen die Hashes zu berechnen und dann mit den anonymisierten Daten zu vergleichen. Lokale Mailadressen sind vom Campus aus via LDAP abrufbar.
Meine Idee wäre, für eine Logdatei z.B. alle Local Parts (links vom @) und alle Domain Parts (rechts vom @) in Arrays einzulesen und dann nur den Index zu verwenden, also localpart12345@domainpart54321.
Vielleicht hat schon jemand so etwas fertig, ansonsten muss ich mir selber
was
schreiben.
Tadaaaa! https://github.com/sys4/loganon
Ist für den Zweck leider nicht geeignet, da es jede Logdatei für sich anonymisiert. Für den Empfänger der anonymisierten Daten ist eine zeitliche Konstanz notwendig, d.h. vornamex.nachnamey@domain muss dauerhaft auf z.B. mailadresse4711 umgesetzt werden. Ich werde mir selber was schreiben, was jede neue Mailadresse in eine Datenbankzeile einträgt und mit einer laufenden Nummer versieht. Damit hat jede Adresse eine eindeutige ID und kann ohne Zugriff auf die Datenbank auch nicht rückgewandelt werden.
Der RA Joerg Heidrich (Heise) hat loganon auf seinen Vorträgen als Beispiel für gute und rechtskonforme Loganonymisierung erwähnt. Ich werte das als "grundsätzlich geeignet". Für eine rechtssichere Auskunft wirst Du ihn selber fragen müssen. Die kann ich mangels Studium und Akkreditierung nicht geben.
p@rick
![](https://secure.gravatar.com/avatar/22e8667219fdb72a7877d659e5be72a6.jpg?s=120&d=mm&r=g)
* Peter Heitzer Peter.Heitzer@rz.uni-regensburg.de:
Ist für den Zweck leider nicht geeignet, da es jede Logdatei für sich anonymisiert. Für den Empfänger der anonymisierten Daten ist eine zeitliche Konstanz notwendig, d.h. vornamex.nachnamey@domain muss dauerhaft auf z.B. mailadresse4711 umgesetzt werden.
Das ist dann keine ANONYMISIERUNG sondern eine PSEUDONYMISIERUNG :)
participants (3)
-
Patrick Ben Koetter
-
Peter Heitzer
-
Ralf Hildebrandt