Jigsawとは

 Jigsaw(ジグソー)は、株式会社デジタルアドバンテージが開発した関連記事自動抽出システムです。一連の記事群において、各記事と関連性の高い類似記事を自動的に選択します。

 Jigsawでは、各記事から単語を抽出し、個々の単語に対してtf-idf(term frequency - inverse document frequency)の値を計算します。このtf-idf 値を要素とするベクトルを考え、記事間の近似度を数値化して、一定以上のスコア(しきい値)となった記事同士を類似記事と見なします。

 記事中の単語分布に基づいて記事を機械的に抽出しているため、場合によっては内容の関連性が低い場合がありますが、あらかじめご了承ください。

開発元:株式会社デジタルアドバンテージ



Windows Server Insider フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Windows Server Insider 記事ランキング

本日 月間