- - PR -
スパムについて
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2006-06-02 17:50
自然言語処理を 含むから スパムフィルターは 「ロングテール」になります。
個人の趣味や ライフワーク にも なりえます。 多言語や自動を狙うなら、ベイズとかSLM(IME2007に採用とか) のような統計手法。 人の頭脳なら、S25R方式 のようなものをひらめかないと。 現在ほしいもの ・ランダムな文字列を判定する正規表現。 「この範囲は英字ランダム(辞書に無い)」 16進や10進は出来ますが。 ・ピンイン、ハングル入力ぽい 部分を判定できる正規表現。 ============== 「エロ丁寧」な文章を判別は 統計手法で 容易と 思いますが [ メッセージ編集済み 編集者: MMX 編集日時 2006-06-02 17:55 ] |
|
投稿日時: 2006-06-02 20:34
自宅サーバでは
・逆引きできないアドレスは不可 ・HELOが正しく無いものは不可 ・MXに登録されていないものは不可 これでかなり件数が減ります。が、世の中には善意のメールサーバでもこれらにマッチしないサーバがあるので、それらからのメールは受け取れなくなります。 会社のサーバはこれほど厳しくはしてませんが、そのうち厳しくするかも... |
|
投稿日時: 2006-06-02 20:53
・逆引きできないアドレスは不可
・HELOが正しく無いものは不可 ・MXに登録されていないものは不可 おっしゃるとおりにこのあたりはビミョーですよね。 どれくらい善意のメールサーバでこれらにマッチしない企業ってあるんでしょうかね。 なぞですね〜。 |