GFI
English Deutsch Français Italiano Nederlands Español
Table of ContentsPreviousNextIndex

Vorteile der Bayes'schen Filtertechnologie

1. Die Bayes'sche Methode berücksichtigt die gesamte Mitteilung. Hierbei werden nicht nur Spam-typische Stichwörter erkannt, sondern auch solche, die in gültiger E-Mail-Korrespondenz vorkommen. Beispiel: Nicht jede E-Mail, in der die Wörter „kostenlos" und „bares Geld" vorkommen, ist als Spam einzustufen. Der Vorteil der Bayes'schen Methode besteht darin, dass Wörter, die am auffälligsten sind (ermittelt durch ihre Abweichung vom gängigen Wortschatz), kontrolliert werden, um dann die Wahrscheinlichkeit für das Vorliegen einer Spam-Mitteilung zu berechnen. Die Bayes'sche Methode würde die Wörter „bares Geld" und „kostenlos" zwar als auffällig einstufen, jedoch gleichzeitig den Namen des Absenders als Geschäftskontakt erkennen und die Mitteilung somit als legitim klassifizieren. Somit wirken mehrere berücksichtigte Wörter und Merkmale als „ausgleichend". Diese Filterung stellt einen wesentlich intelligenteren Ansatz der Spam-Abwehr dar, da alle Merkmale einer Mitteilung untersucht werden - und nicht nur einzelne Stichwörter, deren Verwendung in einer E-Mail bereits ausreicht, diese (fälschlicherweise) als Spam zu klassifizieren.

2. Ein Bayes'scher Filter aktualisiert sich automatisch und kontinuierlich. Der Filter verarbeitet die Merkmale neuartiger Spam-Mitteilungen und neuer, gültiger E-Mails, die verschickt werden, und passt sich somit aktuellen Spam-Methoden und veränderten Korrespondenzgewohnheiten an. Spammer haben früher z. B. die Schreibweise "k-o-s-t-e-n-l-o-s" statt "kostenlos" verwendet, um die Stichwortsuche zu umgehen. Diese Taktik war solange erfolgreich, bis die neue Methode in der Stichwort-Datenbank aufgenommen wurde. Der Bayes'sche Filter hingegen erkennt diese Manipulationen automatisch. Die veränderte Schreibweise wird von ihm sogar als ein eindeutiges Merkmal für Spam gedeutet, da es unwahrscheinlich ist, dass sie in dieser Form in Ham-Mitteilungen vorkommt. Ein weiteres Beispiel für eine auffällige Schreibweise ist die Verwendung des Wortes „5ex" an Stelle von „Sex". Es ist anzunehmen, dass das Wort „5ex" in einer erwünschten Nachricht nicht verwendet wird. Die Wahrscheinlichkeit, dass es sich bei einer Mitteilung mit diesem Wort um Spam handelt, steigt somit.

3. Der Bayes'sche Filter passt sich flexibel an die Benutzerkorrespondenz an. Die Korrespondenzgewohnheiten des Unternehmens in der E-Mail-Kommunikation werden vom Bayes'schen Filter berücksichtigt. So erkennt der Filter z. B. beim Einsatz im E-Mail-System eines Autohändlers, dass das Wort „Hypothek" in einer E-Mail ein Anzeichen für eine Spam-Mitteilung ist, wohingegen der Filter in einem Finanzunternehmen dieses Wort als nicht verdächtig einstufen würde.

4. Die Bayes'sche Methode kann für zur Filterung von Mitteilungen in sämtlichen Sprachen eingesetzt werden, da sich dieser Anti-Spam-Filter automatisch an unterschiedlichste Zeichensätze anpassen lässt. Ein Großteil der Stichwort-Listen ist hingegen nur auf Englisch verfügbar und eignet sich daher nicht zur Kontrolle von in anderen Sprachen verfassten Mitteilungen. Der Bayes'sche Filter berücksichtigt sogar bestimmte sprachliche Abweichungen oder die unterschiedliche Verwendung von Wörtern in verschiedenen Bereichen. Diese intelligente Analyse ermöglicht die Blockierung einer noch größeren Anzahl von Spam-Mitteilungen.

5. Ein Bayes'scher Filter ist schwerer zu überlisten als ein Stichwort-Filter. Versierte Spammer, die einen Bayes'schen Filter täuschen wollen, könnten versuchen, weniger negativ belegte Wörter (Spam-typische wie „kostenlos", „Viagra" etc.) zu verwenden oder mehrere Begriffe, die allgemein auf eine gültige Nachricht hinweisen (z. B. ein gültiger Kontaktname). Letztere Variante kann jedoch nicht realisiert werden, da dem Spammer das E-Mail-Profil eines jeden Empfängers bekannt sein müsste. Für Spam-Versender ist es jedoch so gut wie unmöglich, an diese Information eines jeden potenziellen Empfängers zu gelangen. Bei Verwendung von neutralen Begriffen wie „öffentlich" scheitert dieser Versuch, da diese bei der Endanalyse nicht berücksichtigt werden. Auch die Aufteilung von Spam-typischen Wörtern, z. B. „H-y-p-o-t-h-e-k" an Stelle von „Hypothek" verspricht keinen Erfolg, sondern bewirkt eher das Gegenteil: Wohl kaum ein Benutzer wird die erste Schreibweise in seinen Nachrichten verwenden.

Hinweis zum Einsatz des Bayes'schen Filters

Keine andere Anti-Spam-Technologie ist so effizient in der Abwehr unerwünschter Werbemitteilungen wie die Bayes'sche Filtertechnologie - eine korrekte Implementierung und Anpassung vorausgesetzt. Es besteht jedoch auf den ersten Blick ein Nachteil, der aber nicht sehr gravierend ist: Ein effizienter Einsatz und eine aussagekräftige Beurteilung des Bayes'schen Filters ist erst möglich, nachdem der Filter mindestens zwei Wochen lang Ihre E-Mail-Korrespondenz analysiert und daraus gelernt hat. Eine weitere Möglichkeit wäre, die Ham- und Spam-Datenbanken manuell zu erstellen. Dies ist jedoch sehr zeitaufwändig und komplex, sodass Sie das Ende der Lernphase und automatischen Konfigurierung des Filters abwarten sollten. Im Laufe der gesamten Einsatzzeit verbessert sich zudem die Effizienz des Bayes'sche Filters, da die Anpassung an die Korrespondenzgewohnheiten immer weiter verfeinert wird.


Table of ContentsPreviousNextIndex


   © 2008. Alle Rechte vorbehalten. GFI Software Home Produkte Download-Versionen Support Bestellungen Sitemap Über GFI Kontakt