Perchè il filtro Bayesiano è migliore
1. Il metodo Bayesiano considera l'intero messaggio. Riconosce le parole chiave che identificano lo spam, ma riconosce anche le parole che contraddistinguono le email valide. Per esempio: non tutte le email che contengono i termini "gratis" e "soldi" sono spam. Il vantaggio del metodo Bayesiano è che esso considera i termini più interessanti (come quelli ottenuti da modifiche di altri) e fornisce la probabilità di spam del messaggio. Il filtro Bayesiano potrebbe ritenere i termini "gratis" e "soldi" interessanti, ma è anche in grado di riconoscere il nome commerciale del mittente dell'email e quindi di classificare l'email come legittima, per esempio. Esso consente ai temini di "controbilanciarsi". In altre parole, il filtraggio Bayesiano è un approccio molto più intelligente perché esamina tutti gli aspetti di un messaggio, a differenza della controllo per parola chiave che classifica un'email come spam in base ad una singola parola.
2. Un filtro Bayesiano si adatta costantemente in modo autonomo. Imparando dal nuovo spam e dalle nuove email in uscita valide, il filtro Bayesiano migliora e si adatta alle nuove tecniche di spam. Per esempio, quando gli spammer hanno cominciato ad utilizzare la parola "f-r-e-e" anzichè "free", sono stati in grado di superare il controllo basato su parole chiave finchè anche "f-r-e-e" è stata inclusa nel database di parole chiave. Il filtro Bayesiano, invece, riconosce queste tattiche in modo automatico; infatti, se viene trovato il termine "f-r-e-e", si tratta di un indicatore di spam anche migliore, poiché è improbabile che venga utilizzato in un'email legittima. Un altro esempio può essere l'utilizzo del termine "5ex" invece di "Sex". È improbabile che il termine "5ex" sia presente nella posta legittima, quindi la probabilità che si tratti di spam aumenta.
3. La tecnica Bayesiana è sensibile all'utente. Impara le abitudini legate alla posta elettronica dell'azienda e capisce che, ad esempio, il termine "mutuo" può indicare spam se la società che ha attivato il filtro è una concessionaria di automobili, mentre non lo indicherà come spam se la società è è un istituto finanziario che si occupa di mutui.
4. Il metodo Bayesiano è multilingue e internazionale. Un filtro Bayesiano anti-spam, essendo adattabile, può essere usato per tutte le lingue richieste. La maggior parte degli elenchi di parole chiave sono disponibili soltanto in inglese, pertanto sono pressoché inutili nei paesi in cui non si parla inglese. Il filtro Bayesiano, inoltre, prende in considerazione variazioni di linguaggio o il diverso utilizzo di alcuni termini in differenti aree geografiche, anche se è parlata la stessa lingua. Questo tipo di intelligenza rende tale filtro molto più efficace nella ricerca dello spam.
5. Un filtro Bayesiano, a differenza di un filtro basato su parole chiave, è molto difficile da aggirare. Uno spammer avanzato che voglia superare un filtro Bayesiano può usare o solo pochi termini, che però normalmente indicano spam (ad esempio, gratis, Viagra, ecc.), oppure molti più termini che generalmente indicano email valide (quali il nome di un contatto valido, ecc.) Quest'ultimo caso è impossibile, poichè lo spammer dovrebbe conoscere il profilo email di ciascun destinatario, ma uno spammer non può mai sperare di ottenere questo tipo di informazioni per tutti. L'utilizzo di termini neutri, per esempio il termine "pubblico", potrebbe non funzionare poichè è ignorato nell'analisi finale. Scomporre termini associati allo spam, ad esempio utilizzando "m-u-t-u-o" invece di "mutuo", avrà solo la conseguenza di aumentare la probabilità che il messaggio sia spam, dato che un utente legittimo raramente scriverà il termine "mutuo" come "m-u-t-u-o".
Qual'è il difetto?
Il filtraggio Bayesiano, se implementato nel modo giusto e adattato alle esigenze dell'azienda, è di gran lunga la tecnologia più efficace per combattere lo spam. C'è un lato negativo? Ebbene, in un certo senso esiste un lato negativo, ma può essere facilmente superato: Prima di utilizzare e giudicare il filtro Bayesiano, bisogna attendere almeno due settimane per il suo apprendimento, oppure creare personalmente i database ham o spam. Quest'operazione può essere piuttosto complessa, pertanto è meglio attendere che il filtro abbia tempo di apprendere. Col tempo, il filtro Bayesiano diventa sempre più efficace poiché impara a conoscere di più le abitudini di posta elettronica dell'azienda. Il proverbio dice: "La pazienza è la virtù dei forti".