GFI
English Deutsch Français Italiano Nederlands Español
Table of Contents Previous Next

Der Bayes’sche Anti-Spam-Filter : Vorteile der Bayes’schen Filtertechnologie
1. Die Bayes'sche Methode berücksichtigt die gesamte Mitteilung. Hierbei werden nicht nur Spam-typische Stichwörter erkannt, sondern auch solche, die in gültiger E-Mail-Korrespondenz vorkommen. Beispiel: Nicht jede E-Mail, in der die Wörter „kostenlos“ und „bares Geld““ vorkommen, ist als Spam einzustufen. Der Vorteil der Bayes'schen Methode besteht darin, dass Wörter, die am auffälligsten sind (ermittelt durch ihre Abweichung vom gängigen Wortschatz), kontrolliert werden, um dann die Wahrscheinlichkeit für das Vorliegen einer Spam-Mitteilung zu berechnen. Die Bayes'sche Methode würde die Wörter „bares Geld“ und „kostenlos“ zwar als auffällig einstufen, jedoch gleichzeitig den Namen des Absenders als Geschäftskontakt erkennen und die Mitteilung somit als legitim klassifizieren. Somit wirken mehrere berücksichtigte Wörter und Merkmale als ausgleichend. Diese Filterung stellt einen wesentlich intelligenteren Ansatz der Spam-Abwehr dar, da alle Merkmale einer Mitteilung untersucht werden – und nicht nur einzelne Stichwörter, deren Verwendung in einer E-Mail bereits ausreicht, diese (fälschlicherweise) als Spam zu klassifizieren.
2. Ein Bayes'scher Filter aktualisiert sich automatisch und kontinuierlich. Der Filter verarbeitet die Merkmale neuartiger Spam-Mitteilungen und neuer, gültiger E-Mails, die verschickt werden, und passt sich somit aktuellen Spam-Methoden und veränderten Korrespondenzgewohnheiten an. Zu beliebten Spam-Methoden zählt beispielsweise, dass Spammer versuchen, Spam-typische Wörter zu maskieren, beispielsweise durch Verwendung von „k-o-s-t-e-n-l-o-s“ anstatt von „kostenlos“, um die Stichwort-Kontrolle zu umgehen. Diese Taktik ist solange erfolgreich, bis die neuen Schreibweisen in Stichwort-Datenbanken aufgenommen sind. Der Bayes'sche Filter hingegen erkennt solche Manipulationen von vornherein vollkommen automatisch. Eine veränderte Schreibweise wird von ihm sogar als ein eindeutiges Merkmal für Spam gedeutet, da es unwahrscheinlich ist, dass sie in dieser Form in Ham-Mitteilungen vorkommt. Ein weiteres Beispiel für eine auffällige Schreibweise ist die Verwendung des Wortes „5ex“ an Stelle von „Sex“. Es ist anzunehmen, dass das Wort „5ex“ in einer erwünschten Nachricht nicht verwendet wird. Die Wahrscheinlichkeit, dass es sich bei einer Mitteilung mit diesem Wort um Spam handelt, steigt somit.
3. Der Bayes’sche Filter passt sich flexibel an die Benutzerkorrespondenz an. Die Korrespondenzgewohnheiten des Unternehmens in der E-Mail-Kommunikation werden vom Bayes’schen Filter berücksichtigt. So erkennt der Filter z. B. beim Einsatz im E-Mail-System eines Autohändlers, dass das Wort „Hypothek“ in einer E-Mail ein Anzeichen für eine Spam-Mitteilung ist, wohingegen der Filter in einem Finanzunternehmen dieses Wort als nicht verdächtig einstufen würde.
4. Die Bayes'sche Methode kann für mehrere Sprachen und international eingesetzt werden. Da sich der Bayes'sche Anti-Spam-Filter automatisch anpasst, kann er für jede Sprache eingesetzt werden. Ein Großteil der Stichwort-Listen ist hingegen nur auf Englisch verfügbar und eignet sich daher nicht zur Kontrolle von in anderen Sprachen verfassten Mitteilungen. Der Bayes'sche Filter berücksichtigt sogar bestimmte sprachliche Abweichungen oder Bedeutungsunterschiede von Wörtern je nach Kontext. Diese intelligente Analyse ermöglicht die Blockierung einer noch größeren Anzahl von Spam-Mitteilungen.
5. Ein Bayes'scher Filter ist schwerer zu überlisten als ein Stichwort-Filter. Versierte Spammer, die einen Bayes'schen Filter täuschen wollen, können versuchen, weniger negativ belegte Wörter zu verwenden (keine Spam-typischen wie „kostenlos“, „Viagra“ etc.) oder mehrere Begriffe, die ein allgemeines Merkmal gültiger Nachrichten sind (z. B. ein gültiger Kontaktname). Letztere Variante kann jedoch nicht realisiert werden, da dem Spammer das E-Mail-Profil jedes Empfängers bekannt sein müsste. Für Spam-Versender ist es jedoch so gut wie unmöglich, an diese Information jedes potenziellen Empfängers zu gelangen. Bei Verwendung von neutralen Begriffen wie „öffentlich“ scheitert dieser Versuch, da diese bei der Endanalyse nicht berücksichtigt werden. Auch die Maskierung von Spam-typischen Wörtern, z. B. „H-y-p-o-t-h-e-k“ an Stelle von „Hypothek“ verspricht keinen Erfolg, sondern bewirkt eher das Gegenteil: Wohl kaum ein Benutzer wird die erste Schreibweise in seinen Nachrichten verwenden.

   © 2008. Alle Rechte vorbehalten. GFI Software Home Produkte Download-Versionen Support Bestellungen Sitemap Über GFI Kontakt