フィルタリング技術を開発

国内ブログの4割はスパム、ニフティが調査

2008/03/26

 ニフティは3月26日、スパムブログを自動的判別するフィルタリング技術を開発したと発表した。スパムプログとは、アフィリエイトで広告収入を得ることや、特定のWebサイトへ誘導したりすることを目的として生成されるブログ。特定のキーワードを含む記事やニュースサイトなどから転載した記事を機械的に大量生成して、各種検索サービスからのアクセスを不正に誘導する。

 同社はスパムブログの特性に合わせたフィルタを作成して組み合わせた。スパムブログは2タイプ7種に分類。コンテンツを自動生成する自動生成タイプでは「引用スパム」「アフィリエイトスパム」「ワードサラダ」「自動マルチポスト」の4つ、アダルト系では「わいせつ記事」「出会い系」「ワンクリック詐欺」の3つがある。

 引用スパムは、ほかのブログやニュース記事、検索されやすいキーワードの検索結果スニペットなどの引用を自動的に取得し、記事を生成している。

 アフィリエイトスパムは商品写真とそのアフィリエイトリンクを大量に自動で掲載しているブログで内容がほとんどないないもの。

 ワードサラダは文章をフレーズ単位で機械的に組み合わせて生成しているブログ。一見、人間が書いているように見えるが無意味な文章となっている。

 国内の約9割強をカバーする同社のブログ評判分析サービス「BuzzPulse」(バズパルス)を対象に分析した結果、2007年10月から2008年2月までの5カ月平均で約4割がスパムブログと判明したという。

 今後同社では今回開発したスパムブログフィルタリング技術をBuzzPulseなどに搭載して提供する予定という。

関連リンク

(@IT 西村賢)

情報をお寄せください:

アイティメディアの提供サービス

キャリアアップ


- PR -
ソリューションFLASH

「ITmedia マーケティング」新着記事

生成AIの米中依存、地政学リスクに――BCGが警告
ボストンコンサルティンググループ(BCG)の戦略シンクタンクであるBCGヘンダーソン研究...

Webサイトリニューアル時のSEOチェックポイント 順位を落とさないために必須の12の対応を解説
何らかの目的があって進めるリニューアルではあるものの、検索順位がその代償になってし...

ハッシュタグはオワコン? イーロン・マスク氏も「使うな」と投稿、その意図は……
ハッシュ記号(#)とキーワードを連結させることで投稿のトピックを明示する「ハッシュタ...