Waarom Bayesiaans filteren beter is 1. De Bayesiaanse methode kijkt naar het gehele bericht. De Bayesiaanse filter herkent niet alleen trefwoorden die op spam wijzen, maar ook woorden die op legitieme e-mail wijzen. Bijvoorbeeld: niet iedere e-mail waar het woord 'gratis' of 'cash' in voorkomt is spam. Het voordeel van de Bayesiaanse methode is dat wordt gekeken naar de interessantste woorden (bepaald door de afwijking ten opzichte van het gemiddelde) en vervolgens wordt berekend hoe waarschijnlijk het is dat het om spam gaat. De Bayesiaanse filter let op woorden als 'cash' en 'gratis' maar herkent ook de naam van uw zakenrelatie die het bericht heeft gestuurd en classificeert het bericht vervolgens als legitiem. Doordat alle aspecten van een bericht in overweging worden genomen is Bayesiaans filteren dus een veel intelligentere benadering dan bijvoorbeeld het controleren van trefwoorden, waarbij mail als spam wordt geclassificeerd op basis van een enkel woord. 2. Een Bayesiaanse filter past zich continu aan - doordat de filter leert van nieuwe spam en nieuwe legitieme uitgaande mail, ontwikkelt hij zich en past hij zich aan aan nieuwe spamtechnieken. Bijvoorbeeld: toen spammers 'g-r-a-t-i-s' gingen gebruiken in plaats van 'gratis', kwamen hun berichten door de trefwoordcontrole heen totdat 'g-r-a-t-i-s' werd toegevoegd aan het trefwoordenbestand. De Bayesiaanse filter heeft dergelijke tactieken echter onmiddellijk in de gaten. Sterker nog: als het woord 'g-r-a-t-i-s' wordt gevonden, dan is dat een nog betere indicatie dat het om spam gaat. Het is namelijk onwaarschijnlijk dat dit woord in een hambericht voorkomt. Een ander voorbeeld is het gebruik van het de term '5ex' in plaats van 'Sex'. In een hambericht zou je '5ex' waarschijnlijk niet tegenkomen. De kans is dus groot dat het een spambericht is. 3. De Bayesiaanse filter past zich aan aan de gebruiker. Hij leert over de e-mailgewoonten van het bedrijf en begrijpt dus bijvoorbeeld dat het woord 'hypotheek' op spam kan duiden als het bedrijf dat de filter heeft geïnstalleerd een bedrijf is dat auto's verkoopt maar niet als het een financiële instantie is. 4. De Bayesiaanse methode is meertalig en internationaal. Aangezien de Bayesiaanse antispamfilter zich aanpast, kan hij voor iedere gewenste taal worden gebruikt. De meeste trefwoordenlijsten zijn alleen beschikbaar in het Engels en zijn dus nutteloos in niet-Engelstalige landen. De Bayesiaanse filter houdt tevens rekening met bepaalde afwijkingen van de standaardtaal en de verschillende manieren waarop bepaalde woorden in verschillende regio's worden gebruikt, zelfs als in die regio's dezelfde taal wordt gesproken. Hierdoor kan de filter nog meer spam tegenhouden. 5. In tegenstelling tot een trefwoordenfilter is een Bayesiaanse filter niet gemakkelijk voor de gek te houden. Een geavanceerde spammer die een Bayesiaanse filter voor de gek wil houden kan ofwel minder woorden gebruiken die gewoonlijk op spam wijzen (zoals gratis, Viagra, etc.) ofwel meer woorden gebruiken die gewoonlijk op legitieme e-mail wijzen (zoals de naam van een bestaande contactpersoon). Het laatste is onmogelijk aangezien de spammer van iedere ontvanger het e-mailprofiel nodig zou hebben - en een spammer kan nooit voor iedere ontvanger dit soort informatie verzamelen. Het gebruik van neutrale woorden (bijvoorbeeld het woord 'public') werkt niet aangezien deze in de uiteindelijke analyse genegeerd worden. Het afbreken van woorden die veel in spamberichten worden gebruikt, zoals 'h-y-p-o-t-h-e-e-k' in plaats van 'hypotheek', betekent dat er een grotere kans bestaat dat het bericht spam is, aangezien in een legitieme e-mail het woord "hypotheek" nooit als 'h-y-p-o-t-h-e-e-k' zou worden geschreven. Even geduld alstublieft Als een Bayesiaanse filter op de juiste manier is geïmplementeerd en zich heeft aangepast aan uw bedrijf, dan is er geen betere manier om spam te bestrijden. Zijn er ook nadelen? Er is één nadeel, maar dat hoeft geen al te groot probleem te zijn: voordat u de Bayesiaanse filter kunt gebruiken en beoordelen, moet u hem minstens twee weken de kans geven om zich aan te passen aan uw bedrijf. Als u dit niet doet, moet u zelf de ham- en spamdatabases creëren. Dit is een vrij complexe taak. Het is dus beter om de filter de tijd te geven om zich aan uw bedrijf aan te passen. De Bayesiaanse filter wordt steeds effectiever naarmate hij meer over het e-mailgedrag van uw organisatie leert. Geduld is dus echt een schone zaak!