Por qué es mejor el filtrado Bayesiano
1. El método Bayesiano tiene en cuenta la totalidad del mensaje - Reconoce palabras clave que identifican el spam, pero también reconoce palabras que denotan correo válido. Por ejemplo: no todo el correo que contiene la palabra `free' y `cash' es spam. La ventaja del método Bayesiano es que considera la mayoría de palabras interesantes (definido por su desviación de la media) y da como resultado una probabilidad de que un mensaje sea spam. El método Bayesiano encontraría interesantes las palabras `cash' y `free' pero también reconocería el nombre del contacto de negocio que envió el mensaje y de ese modo clasificar el mensaje como legítimo, por ejemplo; esto permite que las palabras se `mantengan en equilibrio' entre sí. En otras palabras, el filtrado Bayesiano es una estrategia mucho más inteligente porque examina todos los aspectos de un mensaje, en oposición al análisis de palabras clave que clasifican un correo como spam en base a una sola palabra.
2. Un filtro Bayesiano están constantemente auto adaptándose - Mediante el aprendizaje del nuevo spam y la salida de nuevo correo válido, el filtro Bayesiano evoluciona y se adapta a las nuevas técnicas spam. Por ejemplo, cuando los spammers comenzaron a utilizar `f-r-e-e' en lugar de `free' consiguieron eludir los análisis de palabras hasta que `f-r-e-e' fue incluido en la base de datos de palabras. Por otro lado, el filtro Bayesiano advierte automáticamente estas tácticas; de hecho si se encuentra la palabra `f-r-e-e', incluso es un mejor indicador de spam. Otro ejemplo sería utilizar la palabra `5ex' en lugar de `Sex'. Probablemente no tendrá una palabra 5ex en el correo ham, y por lo tanto la posibilidad de ser spam se incrementa.
3. La técnica Bayesiana es sensible al usuario - Aprende los hábitos de correo de la empresa y entiende que, por ejemplo, la palabra `mortgage' podría indicar spam si la empresa que utiliza el filtro es, digamos, un distribuidor de automóviles, mientras que podría no indicar spam si la empresa es una institución financiera que trabaja con hipotecas.
4. El método Bayesiano es multilíngüe e internacional - Un filtro anti-spam Bayesiano, al ser adaptable, puede utilizarse con cualquier idioma necesario. La mayoría de las listas de palabras clave sólo están disponibles en Inglés y son por lo tanto bastante inútiles en regiones no de habla Inglesa. El filtro Bayesiano también tiene en cuenta ciertas desviaciones del lenguaje o los diversos usos de ciertas palabras en areas diferentes, incluso si se habla el mismo idioma. Esta inteligencia lo habilita como un filtro para atrapar más spam.
5. Un filtro bayesiano es dificil de burlar, a diferencia del filtro de palabras - Un spammer avanzado que quiera engañar a un filtro Bayesiano puede utilizar menos palabras `malas' (es decir, palabras que habitualmente indican spam como free, Viagra, etc), o más palabras que generalmente indican correo válido (como un nombre de contacto válido, etc). Haciendo lo último es imposible porque el spammer tendría que conocer el perfil de correo de cada destinatario - y un spammer nunca puede esperar obtener esta clase de información de cada destinatario deseado. Utilizando palabras neutras, por ejemplo la palabra `public', no funcionaría ya que estas son dejadas de lado en el análisis final. Utilizando palabras asociadas con el spam, como utilizar `m-o-r-t-g-a-g-e' en lugar de `mortgage', sólo incrementará la posibilidad de que el mensaje sea spam, ya que un usuario legítimo raramente utilizará la palabra `mortgage' como `m-o-r-t-g-a-g-e'.
¿Qué es lo que captura?
El filtrado Bayesiano, si está implementado correctamente y hecho a la medida de su empresa es de largo la tecnología más efectiva para combatir el spam. ¿Hay algún inconveniente? Bien, de alguna forma hay un inconveniente, pero puede ser fácilmente superado: Antes de poder utilizar y juzgar al filtro Bayesiano, tiene que esperar a que aprenda durante al menos dos semanas - eso o crear usted mismo las bases de datos de ham y spam. Esta tarea puede ser bastante compleja, por lo que es mejor esperar hasta que el filtro haya tenido tiempo de aprender. A lo largo del tiempo, el filtro Bayesiano se vuelve más y más eficaz ya que aprende más sobre los hábitos de correo de su organización. Para citar el antigüo adagio, `Buenas cosas le llegan al que espera'.