Perchè il filtraggio bayesiano è migliore
1. Il metodo bayesiano considera l'intero messaggio, cioè riconosce le parole chiave che identificano lo spam, ma anche i termini che indicano le email valide. Per esempio: non tutte le email contenenti i termini "gratis" e "contanti" sono spam. Il vantaggio del metodo bayesiano è che considera i termini più interessanti (come quelli ottenuti da modifiche di altri) e suggerisce la probabilità di spam del messaggio. Per esempio, il metodo bayesiano considererebbe le parole "contanti" e "gratuito" interessanti, ma riconoscerebbe anche il nome del contatto aziendale mittente; pertanto, classificherebbe il messaggio come legittimo; vale a dire, consente che i termini si controbilancino. In altre parole, il filtraggio bayesiano costituisce un approccio più intelligente perché esamina tutti gli aspetti di un messaggio, a differenza della ricerca per parola chiave, che classifica un'email come spam in base ad una singola parola.
2. Un filtro bayesiano si adatta costantemente in modo autonomo; infatti, apprendendo dal nuovo spam e dalle nuove email valide in uscita, il filtro bayesiano si evolve e adegua alle nuove tecniche di spam. Per esempio, quando gli spammer hanno cominciato ad utilizzare la parola "g-r-a-t-i-s" anzichè "gratis" sono riusciti a superare il controllo basato su parole chiave, fino a quando anche la parola "g-r-a-t-i-s" è stata inserita nel database. Il filtro bayesiano, invece, riconosce queste tattiche in modo automatico; infatti, se viene trovato il termine "g-r-a-t-i-s", si tratta di un indicatore di spam anche migliore, poiché è improbabile che venga utilizzato in un'email legittima. Un altro esempio può essere l'utilizzo della parola "5ex" anziché "Sex". È improbabile che il termine "5ex" sia presente in un'email ham, quindi la probabilità che si tratti di spam aumenta.
3. La tecnica bayesiana è "sensibile" all'utente, cioè, impara le abitudini di posta elettronica dell'azienda e comprende che, ad esempio, il termine "mutuo" può indicare spam se la società che ha attivato il filtro è una concessionaria di automobili, mentre non lo indicherà come spam se la società è un istituto finanziario che si occupa di mutui.
4. Il metodo bayesiano è multilingue e internazionale, cioè, il filtro antispam bayesiano, essendo adattabile, è utilizzabile in tutte le lingue richieste. La maggior parte degli elenchi di parole chiave è disponibile soltanto in lingua inglese, pertanto sono pressoché inutili nei paesi in cui si parlano altre lingue. Il filtro bayesiano, inoltre, prende in considerazione variazioni di linguaggio o il diverso utilizzo di alcuni termini da parte di parlanti della stessa lingua in differenti aree geografiche. Questo tipo di intelligenza consente al filtro di catturare una maggiore quantità di spam.
5. A differenza di un filtro basato su parole chiave, il filtro bayesiano è molto difficile da raggirare. Uno spammer avanzato che voglia superare un filtro Bayesiano può usare o solo pochi termini, che però normalmente indicano spam (ad esempio, gratis, Viagra, ecc.), oppure più termini che, in generale, indicano email valide (quali il nome di un contatto valido, ecc.) Quest'ultimo caso è impossibile, poiché lo spammer dovrebbe conoscere il profilo email di ciascun destinatario, ma uno spammer non può mai sperare di raccogliere questo tipo di informazioni da ogni destinatario preso di mira. Anche l'utilizzo di termini neutri, per esempio la parola "pubblico", non funzionerebbe, dato che queste parole vengono ignorate durante l'analisi finale. La scomposizione di termini associati allo spam, ad esempio utilizzare "m-u-t-u-o" invece di "mutuo", non farà che incrementare la probabilità che il messaggio sia spam, poiché un utente legittimo raramente scriverà il termine "mutuo" come "m-u-t-u-o".
Dov'è il tranello?
Il filtraggio bayesiano, se implementato nel modo giusto e adattato alle esigenze dell'azienda, costituisce la tecnologia di gran lunga più efficace per combattere lo spam. Vi è un lato negativo? Ebbene, in un certo senso esiste un lato negativo, ma può essere facilmente superato: prima di utilizzare e giudicare il filtro bayesiano, si deve attendere almeno due settimane per il suo apprendimento, oppure si devono creare personalmente i database ham o spam. Dato che quest'ultima operazione può essere piuttosto complessa, è più opportuno attendere che il filtro abbia avuto tempo di apprendere. Col tempo, il filtro bayesiano diventa sempre più efficace, in quanto impara a conoscere sempre di più le abitudini di posta elettronica dell'azienda. Il proverbio dice: "La pazienza è la virtù dei forti".