- PR -

スパムについて

投稿者投稿内容
MMX
ぬし
会議室デビュー日: 2001/10/26
投稿数: 861
投稿日時: 2006-06-02 17:50
自然言語処理を 含むから スパムフィルターは 「ロングテール」になります。
個人の趣味や ライフワーク にも なりえます。

多言語や自動を狙うなら、ベイズとかSLM(IME2007に採用とか) のような統計手法。

人の頭脳なら、S25R方式 のようなものをひらめかないと。

現在ほしいもの
・ランダムな文字列を判定する正規表現。
「この範囲は英字ランダム(辞書に無い)」
16進や10進は出来ますが。
・ピンイン、ハングル入力ぽい 部分を判定できる正規表現。
==============
「エロ丁寧」な文章を判別は 統計手法で 容易と 思いますが

[ メッセージ編集済み 編集者: MMX 編集日時 2006-06-02 17:55 ]
非武装エリア
大ベテラン
会議室デビュー日: 2004/03/03
投稿数: 202
お住まい・勤務地: 日本・たこ部屋
投稿日時: 2006-06-02 20:34
自宅サーバでは

・逆引きできないアドレスは不可
・HELOが正しく無いものは不可
・MXに登録されていないものは不可

これでかなり件数が減ります。が、世の中には善意のメールサーバでもこれらにマッチしないサーバがあるので、それらからのメールは受け取れなくなります。
会社のサーバはこれほど厳しくはしてませんが、そのうち厳しくするかも...
オマーン
常連さん
会議室デビュー日: 2005/12/20
投稿数: 26
投稿日時: 2006-06-02 20:53
・逆引きできないアドレスは不可
・HELOが正しく無いものは不可
・MXに登録されていないものは不可


おっしゃるとおりにこのあたりはビミョーですよね。
どれくらい善意のメールサーバでこれらにマッチしない企業ってあるんでしょうかね。
なぞですね〜。

スキルアップ/キャリアアップ(JOB@IT)