アドレス、ドメインのみのブロックリストではいまいち防ぎきれていなかったようなのでキーワードによるフィルタリングも追加した。 とりあえず以下の正規表現フィルタを追加。
/(cool|nice|good)\s+site\.\s*thank/i /(cool|nice|good)\s+site\s+look\s+this/i
Cool site. Thanks!
やら Good site look this
やらのスパムがやたら多いのでこれらをまとめてはじく設定に。
これが面白いようにひっかかる。
アドレスのみの設定では拾いきれていないようなものは大抵これでゴミ箱送りに出来る。
それでもまだまだスパム判定されないものが残っていたので、コメント中のリンク数を2個以上で未公開、5個以上でスパムとしたことでコメントスパムはほぼシャットアウトできた。
アドレスブロックに関しては niku.2ch.net の精度の高さに驚かされる。 bsb.spamlookup.net の方が先に判定されているにもかかわらずドメインブロックの大半を担っているから相当なものだ。 順番を入れ替えたら全部 niku.2ch.net になってしまうのではないか。
ドメインでのブロックは rbl.bulkfeeds.jp の一人勝ち状態。 英語スパムしかないはずなのにデフォルトのデータベースはまったく役に立っていない。 負荷軽減のため rbl.bulkfeeds.jp 一本に絞るべきかな。
コメントする