E-Mail-Dubletten
E-Mails, die an mehrere Empfänger gesendet werden, können unter gewissen Umständen in mindestens zwei der Empfängerpostfächer durch identische MIME-Dateien repräsentiert sein. Wir sprechen dann von E-Mail-Dubletten.
DublettenE-Mail-DublettenMehrempfänger-E-MailE-Mail-Dubletten
E-Mail-Dubletten sind vom E-Mail-Server ausgelieferte MIME-Dateien, deren Byte-Sequenzen paarweise identisch sind.
Mehrempfänger-E-Mail
Wir sprechen von einer Mehrempfänger-E-Mail, wenn eine E-Mail an mehr als einen Empfänger versendet wird.
Beachten Sie: Wird eine E-Mail an mehr als einen Empfänger versendet, können dabei E-Mail-Dubletten entstehen. Aus der Menge der Empfänger einer Mehrempfänger-E-Mail kann die Anzahl der E-Mail-Dubletten nicht hergeleitet werden.
Konsequenzen
E-Mail-Dubletten können nur mit vollständigem Inhalt zweier MIME-Dateien erkannt werden. Das heißt, es gibt außer eines exakten Inhaltsvergleichs bzw. Vergleichs zweier MD5-Werte keine Möglichkeit, Dubletten zu erkennen. Die Erkennung von Dubletten erscheint mit dem Ziel der Speicherplatzoptimierung sinnvoll zu sein. Dies basiert aber auf der falschen Annahme, dass nur durch einmalige Ablage doppelter Exemplare Speicherverschwendung zu vermeiden sei. Der richtige Ansatz besteht jedoch darin, einen MD5-Pfad als physischen Ablagepfad zu konfigurieren, womit automatisch dafür gesorgt wird, dass die Dateien von Dubletten physisch nur einmal existieren. Diese Methode wird passive Dublettenkontrolle genannt. Der Ansatz, E-Mail-Dubletten vor ihrer Ablage zu erkennen, sorgt für einen leistungsmindernden und dabei gleichzeitig überflüssigen Mehraufwand.
Zur postfachübergreifenden Erkennung von Mehrempfänger-E-Mails können die Nachrichtenattribute PidTagInternetMessageId und PidTagSearchKey direkt verwendet werden. Das Pseudo-Attribut EloSearchKey versucht, zuerst PidTagInternetMessageId zu verwenden, und bei Fehlen dieses Attributs, PidTagSearchKey zu finden.
Berücksichtigen Sie Folgendes bei der Verwendung dieser Attribute:
- Die Bestimmung von Mehrempfänger-E-Mails ist keine Ersatzerkennung von E-Mail-Dubletten. Es kommt sehr oft vor, dass Mehrempfänger-E-Mails paarweise keine E-Mail-Dubletten sind.
- Die beiden Attribute sind nicht für alle Exchange-Elemente verfügbar bzw. sind zur Erkennung von Mehrempfänger-E-Mails teilweise bedeutungslos.
- Die Ermittlung aller Postfächer einer Mehrempfänger-E-Mail kann auch BCC-Empfänger offenbaren. Es ist deshalb in jedem Anwendungsfall gründlich zu überdenken, ob dadurch Richtlinien des Datenschutzes verletzt werden.