« mixiのポータル化、はてなの窮屈 | トップ | レフトの日 »

2006年02月09日

努力は惜しまず。巧妙化するスパム。(スパム・うぉっちんぐ)

最近のスパムフィルターの検知率がいかほどかは知らないが、確実に低下してきているのではないだろうか?
以前にも書いたが、最近は

1.小説や普通の文章を埋め込む。
2.言葉の言い換えを多用して特定の単語を使わない。
3.文章を画像化して貼り付ける。

などの傾向が顕著だ。ただし、日本語のスパムについてはまだここまでは行っておらず、そのものズバリの内容のものが多いが・・・

1.2.は明らかにベイジアンフィルターなどを使ったスパムフィルター対策であり、3.もその究極の「解法」であるのは間違いない。
1.については3.との組み合わせが良く見られ、ハリーポッター絡みの 文章が引用されることが多いようだ。
2.は非常に巧妙で、はっきり云って私などには何が書いてあるのかチンプンカンプンのことが多い(笑
ま、必ずといっていいくらいURLが張ってあるので、文章を読んでもら う必要はないのかも知れないが。

特に最近は3.のパターンが増えており、画像添付されたメールの9割はこの種のスパムである。しかも詳しく見てみると、実に巧妙と言うか手間を惜しまず技巧を凝らしていることがわかる。まったく毎度思うことだが、こんなことに能力を注ぐのではなく・・・

それはともかく、下記の二枚の絵を見てほしい。
RNJEKX.gif
JQXILTJ.gif
違いがわかるだろうか?
ちょっとわかりにくいので、一部を拡大してみたのが下記だ。上下に二枚を貼り付けて、間に線を入れてみた。
RNJEKX2.GIF
文字そのものは全く同じだが、微妙に入っているノイズの位置が違うのだ。
これだけではわからないと思うが、実は同じ出所と思われるスパムでも一枚一枚このように違う位置にノイズが入ってる。いったいどうやってるのか知らないが、おそらく「スパムキット」には送信毎に文字列から画像を生成するツールが入っているのだろう。そのツールが、毎回ランダムにノイズを混入して画像を生成している・・・そうとしか思えない。
こうして、まったく同じパターンの画像ファイルが出来ないため、単純にファイル内容でスパム判定するわけには行かないようになっている。
そろそろスパムフィルターもOCR機能が必要となってきたようだ。

それにしてもなんとも・・・努力賞ものだね。やれやれ(-.-)

投稿者 shoda T. : 2006年02月09日 20:28

トラックバック

このエントリーのトラックバックURL:
http://shoda.tk/MT/mt-tb.cgi/173

コメント

コメントしてください

名前とメールアドレスは必須です。メールアドレスはブログ上には表示されません。私に届くだけです。 TypeKey ID のサイン・インも必須ではありません。持ってる方だけサイン・インすればいいです。




保存しますか?

(書式を変更するような一部のHTMLタグを使うことができます)