Enda et nytt behov i spam-filteret

For en ukes tid siden skrev jeg om at jeg og Espen Andersson samarbeidet om et regulært uttrykk for å ta knekken på mange spam-poster med en spesiell struktur og form. Nå viser det seg at enda en måte har dukket og, og Espen banket på døren en gang til. Derfor legger jeg også dette regulære uttrykket til i spamfilteret:

  1. if (preg_match('/([^\n]+){11,16}\s?\n?\s?((f|ht)tp:\/\/[a-z0-9~#%@\&:=?\/\.,_-]+[a-z0-9~#%@\&=?;\+\/_-]+)\s?|\s=((f|ht)tp:\/\/[a-z0-9~#%@\&:=?\/\.,_-]+[a-z0-9~#%@\&=?;\+\/_-]+)\s?/i', $str) {
  2.    // Spam!
  3. }

Når vi først er inne på det ser vi at det er veldig særskilte poster disse spam-kommentarene. Så det er ganske greit å filtrere de ut, men man må komme med nye regulære uttrykk ganske gjevnlig. Derfor er planen min til spamfilteret mitt å ha en database hvor brukerne kan hente ned regulere uttrykk som jeg lager fra. Slik trenger de ingen kunnskaper om RegExp selv.

Eventuelt vil det komme en liste hvor de kan legge til i sin egen database! Vi får se hva som skjer når jeg kommer med spamkilleren min, noe som har blitt utsatt enda en gang.

Legg igjen respons

Fyll ut alle felt markert med *

Brukerinformasjon
  1. Kan bruke følgende html: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong> og [html] [css], [mysql] og [php] Hold posten ren og fin!

    Siter valgt tekst

E-post-varsel uten å skrive kommentar.

Info om posten

Innlegget ble postet 31.01.07 00:04 og ligger under kategorien PHP / MySQL. Du kan abonnere på kommentarene ved å bruke RSS 2.0 feed. Du kan legge til kommenter, eller trackback fra din blogg/side.

Resurser

Arkiver

Metainfo


Siste Flickr-bilder

  • Commentsystem (20070308)
  • Ukraina Aksjonen 2006 (20070306)
  • Mikael Brevik blogg (20070306)
  • Mikael Brevik (20070306)
  • Brukerdefinert side - AVIS2 (20070306)
  • Brevik Webutvikling (20070306)
  • skyscraper
  • visittkort